منذ أسبوعين
أهلا بك عزيزي المتابع لموقع (journey for learn) نقدم دورات بكوبونات متاحة لاول 1000 تسجيل مجاني فقط وكوبونات اخري لفترة محدودة فاذا كنت تريد ان تحصل علي كل الكورسات علي موقعنا وان تكون اول المسجلين في الكورسات المجانية قم بتسجيل الدخول أوقم بالدخول علي وسائل التواصل الاجتماعي وخصوصا التليجرام نوضح الوصف المختصر والطويل للدورات لكي تعرف الدروس التي سوف تتعلمها بسهولة ويسر :
تغطية تفصيلية لنطاق الاختبار- هندسة البيانات على Databricks (55%) المواضيع: تصميم وتنفيذ خطوط أنابيب البيانات باستخدام Databricks، تطوير حلول معالجة بيانات قوية وعالية الجودة وقابلة للتطوير باستخدام Databricks، نشر وإدارة تطبيقات Apache Spark على Databricks
- تخزين البيانات وإدارتها (20%) المواضيع: تصميم وتنفيذ حلول فعالة لتخزين البيانات باستخدام نظام ملفات Databricks (DBFS)، إدارة البيانات باستخدام Apache Spark و لبنة البيانات، ومراقبة واستكشاف الأخطاء وإصلاحها للمشكلات المتعلقة بالبيانات
- إدارة البيانات وأمنها (15%) المواضيع: فهم وتنفيذ أفضل ممارسات إدارة البيانات على لبنة البيانات، وإدارة التحكم في الوصول، وتشفير البيانات، وإخفاء البيانات على لبنة البيانات، وتدقيق وتسجيل أنشطة البيانات على لبنة البيانات
- منصة البيانات والهندسة المعمارية (10%) المواضيع: فهم ميزات وإمكانات منصة Databricks، تصميم وتنفيذ بنيات البيانات المثالية على لبنة البيانات، استكشاف الأخطاء وإصلاحها مشكلات الأداء المتعلقة بالبيانات في Databricks
- السؤال 1: ما هي ميزة Databricks المصممة خصيصًا لتبسيط إنشاء خطوط بيانات موثوقة وتنسيقها وإدارتها باستخدام نهج تعريفي؟
- الخيار أ: Databricks SQL
- الخيار ب: جداول دلتا المباشرة
- الخيار ج: MLflow
- الخيار د: Databricks Repos
- الخيار E: Unity Catalog
- الخيار F: Databricks Workspace
- الإجابة الصحيحة: الخيار B
- الشرح:
- الخيار A غير صحيح لأن Databricks SQL يُستخدم للاستعلام عن مستودعات البيانات باستخدام SQL وبناء تصورات، وليس لتنظيم البيانات التعريفية. خطوط الأنابيب،
- الخيار B صحيح لأن Delta Live Tables (DLT) هو إطار عمل لبناء مسارات معالجة بيانات موثوقة وقابلة للصيانة وقابلة للاختبار باستخدام المنطق التعريفي،
- الخيار C غير صحيح لأن MLflow يستخدم لإدارة دورة حياة التعلم الآلي،
- الخيار D غير صحيح لأن Databricks Repos يوفر تكامل Git للتحكم في الإصدار،
- الخيار E غير صحيح لأن Unity Catalog يوفر إدارة موحدة للبيانات والذكاء الاصطناعي الأصول،
- الخيار F غير صحيح لأن Databricks Workspace هي البيئة التعاونية، وليست أداة تنسيق خطوط الأنابيب،
- السؤال 2: عند كتابة البيانات إلى جدول Delta، تدرك أن DataFrame الوارد يحتوي على عمود جديد غير موجود في الجدول الهدف. كيف يمكنك تحديث مخطط الجدول الهدف تلقائيًا ليشمل هذا العمود الجديد أثناء عملية الكتابة؟
- الخيار أ: عن طريق تشغيل أمر OPTIMIZE قبل كتابة البيانات
- الخيار ب: باستخدام تكوين .option("overwriteSchema", "true")
- الخيار ج: عن طريق تشغيل أمر VACUUM لمسح بيانات تعريف المخطط القديم
- الخيار د: باستخدام .option("mergeSchema", "true") التكوين
- الخيار E: عن طريق إعادة تشغيل مجموعة Databricks
- الخيار F: باستخدام سطر أوامر DBFS لتغيير ملف المخطط مباشرة
- الإجابة الصحيحة: الخيار D
- الشرح:
- الخيار A غير صحيح لأن OPTIMIZE يستخدم لضغط الملفات الصغيرة وتحسين أداء القراءة،
- الخيار B غير صحيح لأنه يستبدل overwriteSchema المخطط والبيانات الموجودة بالكامل، بدلاً من دمج أعمدة جديدة،
- الخيار C غير صحيح لأن VACUUM يزيل ملفات البيانات التي لم يعد يشار إليها بواسطة جدول Delta،
- الخيار D صحيح لأن mergeSchema يسمح لـ Delta Lake بتطوير المخطط بأمان عن طريق إضافة أعمدة جديدة إلى الجدول الموجود،
- الخيار E غير صحيح لأن إعادة تشغيل المجموعة ليس له أي تأثير على جدول Delta المخططات،
- الخيار F غير صحيح لأنه لا يمكنك تغيير مخططات دلتا عن طريق تعديل الملفات مباشرة عبر DBFS CLI،
- السؤال 3: في سياق إدارة البيانات والأمن في Databricks، ما هي الوظيفة الأساسية لكتالوج Unity؟
- الخيار أ: توفير حل إدارة مركزي لجميع البيانات وأصول الذكاء الاصطناعي عبر مساحات عمل متعددة
- الخيار ب: لجدولة وظائف Apache Spark الآلية وتشغيلها
- الخيار ج: لتصور البيانات باستخدام لوحات معلومات BI
- الخيار د: لتوفير إمكانات التدفق في الوقت الفعلي المشابهة لـ Apache Kafka
- الخيار E: لقياس عقد المجموعة تلقائيًا بناءً على عبء العمل
- الخيار F: لترحيل قواعد البيانات المحلية إلى السحابة
- الإجابة الصحيحة: الخيار أ
- الشرح:
- الخيار أ هو صحيح لأن Unity Catalog هو حل الإدارة الموحد للبيانات والذكاء الاصطناعي في Databricks Lakehouse، مما يسمح لك بإدارة الوصول مركزيًا،
- الخيار B غير صحيح لأن مهام سير عمل Databricks والوظائف تستخدم لجدولة المهام،
- الخيار C غير صحيح لأن Databricks SQL وأدوات BI المتكاملة تتعامل مع التصور،
- الخيار D غير صحيح لأن التدفق المنظم يتعامل مع تدفق البيانات في الوقت الفعلي،
- الخيار E غير صحيح لأن يعد القياس التلقائي إحدى ميزات تكوين المجموعة، وليست ميزة حوكمة،
- الخيار F غير صحيح لأن Unity Catalog ليس أداة ترحيل قاعدة بيانات،
- مرحبًا بك في أكاديمية Mock Exam Practice Tests Academy لمساعدتك في الاستعداد لامتحان مساعد مهندس بيانات معتمد من Databricks،
- يمكنك إعادة إجراء الاختبارات عدة مرات كما تريد،
- هذا سؤال أصلي ضخم البنك،
- تحصل على الدعم من المدربين إذا كانت لديك أسئلة،
- يحتوي كل سؤال على شرح مفصل،
- متوافق مع الهاتف المحمول مع تطبيق Udemy،
ما هي المتطلبات الأساسية لدخول الدورة والتسجيل فيها على موقعنا؟ رحلة التعلم:
(احصل على الدورة للدخول إلى الموقع والتسجيل)
يجب أن يكون لديك بريد إلكتروني (حساب بريد) تتذكره لنفسك وأيضًا يجب أن تتذكر كلمة مرور البريد الإلكتروني الذي ستسجل به ، وإذا لم يكن لديك حساب بريد إلكتروني ، فمن الأفضل إنشاء حساب (Gmail)
الدورات المقترحة
0 تعليقات
تسجيل دخول