منذ ساعة
أهلا بك عزيزي المتابع لموقع (journey for learn) نقدم دورات بكوبونات متاحة لاول 1000 تسجيل مجاني فقط وكوبونات اخري لفترة محدودة فاذا كنت تريد ان تحصل علي كل الكورسات علي موقعنا وان تكون اول المسجلين في الكورسات المجانية قم بتسجيل الدخول أوقم بالدخول علي وسائل التواصل الاجتماعي وخصوصا التليجرام نوضح الوصف المختصر والطويل للدورات لكي تعرف الدروس التي سوف تتعلمها بسهولة ويسر :
الإعداد لمقابلة مستودع البيانات: إتقان البنى الحديثة استمتع بمقابلتك التالية في مجال هندسة البيانات من خلال أكثر من 300 سؤال تدريبي واقعي وتفسيرات متعمقة. تم تصميم أسئلة التدريب على مقابلة مستودع البيانات لسد الفجوة بين المعرفة النظرية والواقع عالي المخاطر لأدوار هندسة البيانات الحديثة. لقد صممت هذه الدورة التدريبية بدقة للتأكد من أنك لا تحفظ التعريفات فحسب، بل تفهم في الواقع "السبب" وراء القرارات المعمارية مثل الاختيار بين Kimball وInmon أو التنقل من ETL إلى ELT في البيئات السحابية مثل Snowflake وBigQuery. سواء كنت تتعامل مع سيناريوهات SCD المعقدة من النوع 4، أو تعمل على تحسين أداء استعلام MPP، أو تنفيذ Data Vault 2.0 لقابلية التوسع، فأنا أقدم الممارسات الصارمة والمبررات التفصيلية التي تحتاجها للتحدث بسلطة أثناء الجولات الفنية. من خلال التركيز على "حزمة البيانات الحديثة"، بما في ذلك قواعد البيانات ومستودعات البيانات وCI/CD الصارمة لخطوط الأنابيب، أساعدك على إظهار الخبرة رفيعة المستوى التي يبحث عنها القائمون على التوظيف بنشاط في السوق التنافسية اليوم. مجالات الاختبار ونماذج الموضوعات- الأساسيات والنمذجة: Kimball/Inmon، Star/Snowflake، أنواع SCD (1-6)، Data Vault 2.0، Galaxy المخططات.
- ETL/ELT والتكامل: CDC، Idempotency، الردم، التدريج، معالجة JSON/Parquet، تكامل API.
- الأداء والتحسين: الفهرسة مقابل التقسيم، طرق العرض المادية، مفاتيح التوزيع، MPP، خطط التنفيذ.
- التخزين السحابي والأدوات: Snowflake/BigQuery/Redshift، شبكة البيانات مقابل النسيج، Lakehouses، dbt، CI/CD.
- الحوكمة والأمن: نسب البيانات، إخفاء PII، RBAC، اتفاقيات مستوى الخدمة لجودة البيانات، الامتثال للقانون العام لحماية البيانات/SOC2.
- السؤال 1: في بيئة مستودع البيانات السحابية الحديثة باستخدام نهج ELT، لماذا هل تعتبر "الثبات" خاصية مهمة لمهام تحويل خطوط أنابيب البيانات؟
- أ) تضمن تشفير البيانات أثناء الراحة وأثناء النقل.
- ب) تسمح بإعادة تشغيل المهمة عدة مرات باستخدام نفس المدخلات لإنتاج نفس المخرجات دون تكرار البيانات أو إتلافها.
- ج) تقوم تلقائيًا بتحويل التخزين القائم على الصفوف إلى تنسيق عمودي لضغط أفضل.
- د) تضمن أن البيانات تستوفي النموذج العادي الثالث (3NF) قبل دخول المستودع.
- هـ) يحد من تكلفة الحوسبة عن طريق منع محرك الاستعلام من التوسع أفقيًا.
- F) إنه متطلب للحفاظ على امتثال SOC2 في إعداد التقارير المالية.
- الإجابة الصحيحة: ب
- الشرح العام: العجز هو متطلب وظيفي في هندسة البيانات حيث يمكن تطبيق العملية عدة مرات دون تغيير النتيجة بما يتجاوز التطبيق الأولي. يعد هذا أمرًا حيويًا للتسامح مع الأخطاء وإعادة محاولة تشغيل خطوط الأنابيب الفاشلة.
- تحليل تفصيلي للخيارات:
- ج: غير صحيح؛ وهذا يصف بروتوكولات الأمان، وليس العجز.
- ب: صحيح؛ هذا هو تعريف العجز، مما يضمن الاتساق أثناء إعادة المحاولة.
- ج: غير صحيح؛ هذه إحدى ميزات تحسين التخزين، ويتم التعامل معها عادةً من خلال تنسيق الملف (على سبيل المثال، Parquet).
- د: غير صحيح؛ التطبيع هو اختيار نمذجة، وليس خاصية خط الأنابيب.
- E: غير صحيح؛ idempotency does not restrict compute scaling.
- F: Incorrect; على الرغم من أنها ممارسة جيدة، إلا أنها ليست متطلبًا قانونيًا مباشرًا لـ SOC2.
- السؤال 2: ما نوع البعد المتغير ببطء (SCD) الذي ستنفذه إذا كانت متطلبات العمل تتطلب تتبع السجل الكامل للتغييرات مع توفير "علامة حالية" و"تاريخ سريان" لتسهيل التصفية؟
- أ) النوع 0
- ب) النوع 1
- ج) النوع 2
- د) النوع 3
- E) النوع 4
- F) النوع 6
- الإجابة الصحيحة: C
- الشرح العام: SCD النوع 2 هو معيار الصناعة لتتبع البيانات التاريخية عن طريق إنشاء صفوف جديدة لكل تغيير، باستخدام أعمدة البيانات التعريفية لتحديد السجلات الحالية مقابل السجلات التاريخية.
- تحليل الخيارات التفصيلي:
- أ: غير صحيح؛ النوع 0 هو "ثابت"، مما يعني عدم السماح بأي تغييرات.
- ب: غير صحيح؛ النوع 1 يقوم بالكتابة فوق البيانات، ويفقد كل السجل.
- ج: صحيح؛ يستخدم النوع 2 مفاتيح بديلة وإصدارات (تواريخ/علامات) لتتبع السجل الكامل.
- د: غير صحيح؛ النوع 3 يتتبع فقط القيم "السابقة" و"الحالية" في أعمدة منفصلة.
- E: غير صحيح؛ يستخدم النوع 4 جدول سجل منفصل بدلاً من العلامات في البعد الرئيسي.
- F: غير صحيح؛ النوع 6 (2+3+1) هو نهج مختلط وغالبًا ما يكون مبالغًا فيه لتتبع التاريخ البسيط.
- السؤال 3: في بنية المعالجة المتوازية الضخمة (MPP) مثل Amazon Redshift أو Azure Synapse، ما هو الخطر الأساسي لاختيار مفتاح توزيع ذو عدد أساسي منخفض لجدول حقائق كبير؟
- أ) يؤدي إلى "انحراف البيانات"، حيث يحدث ذلك بشكل ملحوظ في بعض العقد عمل أكثر من الآخرين.
- ب) إنه يفرض على النظام استخدام مخطط النجمة بدلاً من مخطط ندفة الثلج.
- ج) يؤدي تلقائيًا إلى تشغيل فراغ جدول كامل بعد كل إدراج.
- د) إنه يزيد من تكلفة التخزين عن طريق تكرار البيانات عبر جميع العقد.
- هـ) يمنع استخدام طرق العرض المادية على هذا الجدول المحدد.
- و) إنه يعطل القدرة على استخدام التحكم في الوصول المستند إلى الدور (RBAC).
- الإجابة الصحيحة: أ
- الشرح العام: تقوم أنظمة MPP بتوزيع البيانات عبر عقد متعددة. إذا كان مفتاح التوزيع يحتوي على عدد قليل من القيم الفريدة (قيمة أساسية منخفضة)، فلا يمكن توزيع البيانات بالتساوي، مما يتسبب في "النقاط الفعالة" أو الانحراف الذي يؤدي إلى إبطاء المجموعة بأكملها.
- تحليل الخيارات التفصيلي:
- ج: صحيح؛ يؤدي انخفاض عدد العناصر إلى تجميع البيانات في عقد محددة، مما يؤدي إلى اختناق الأداء.
- ب: غير صحيح؛ مفاتيح التوزيع مستقلة عن تصميم المخطط المنطقي.
- C: غير صحيح؛ يعد التنظيف بالمكنسة الكهربائية مهمة صيانة لا علاقة لها بأصل مفتاح التوزيع.
- د: غير صحيح؛ يصف هذا التوزيع "الكل" أو "البث"، وليس خطرًا رئيسيًا محددًا.
- E: غير صحيح؛ لا يزال من الممكن استخدام طرق العرض المجسدة، على الرغم من أنها قد تعاني أيضًا من الانحراف.
- F: غير صحيح؛ تتم إدارة الأمان (RBAC) في طبقة البيانات التعريفية، وليس طبقة التوزيع الفعلية.
- مرحبًا بك في أفضل الاختبارات التدريبية لمساعدتك في الاستعداد للأسئلة التدريبية للمقابلة الخاصة بمستودع البيانات.
- يمكنك إعادة إجراء الاختبارات عدة مرات كما تريد
- هذا بنك أسئلة أصلي ضخم
- يمكنك الحصول على الدعم من المدرسين إذا كان لديك الأسئلة
- كل سؤال له شرح مفصل
- متوافق مع الهاتف المحمول مع تطبيق Udemy
- ضمان استرداد الأموال لمدة 30 يومًا إذا لم تكن راضيًا
ما هي المتطلبات الأساسية لدخول الدورة والتسجيل فيها على موقعنا؟ رحلة التعلم:
(احصل على الدورة للدخول إلى الموقع والتسجيل)
يجب أن يكون لديك بريد إلكتروني (حساب بريد) تتذكره لنفسك وأيضًا يجب أن تتذكر كلمة مرور البريد الإلكتروني الذي ستسجل به ، وإذا لم يكن لديك حساب بريد إلكتروني ، فمن الأفضل إنشاء حساب (Gmail)
0 تعليقات
تسجيل دخول
دورات مشابهة