منذ يوم
أهلا بك عزيزي المتابع لموقع (journey for learn) نقدم دورات بكوبونات متاحة لاول 1000 تسجيل مجاني فقط وكوبونات اخري لفترة محدودة فاذا كنت تريد ان تحصل علي كل الكورسات علي موقعنا وان تكون اول المسجلين في الكورسات المجانية قم بتسجيل الدخول أوقم بالدخول علي وسائل التواصل الاجتماعي وخصوصا التليجرام نوضح الوصف المختصر والطويل للدورات لكي تعرف الدروس التي سوف تتعلمها بسهولة ويسر :
تغطية مفصلة لنطاق الاختبار، تم تنظيم مستودع اختبار الممارسة هذا بشكل منهجي ليعكس التوزيعات الفنية الدقيقة ومعايير التقييم الصارمة الموجودة في لجان المقابلات الفنية لعلوم البيانات النخبة.- الإحصائيات (20%): إتقان الإحصائيات الوصفية مقابل الاستدلالية، وديناميكيات الانحدار الخطي واللوجستي، والتصميم التجريبي القوي (بروتوكولات اختبار A/B)، وتركيبات اختبار الفرضيات، وتفسيرات القيمة p، وفترات الثقة الإحصائية.
- التعلم الآلي (25%): التعمق في بنيات التعلم الخاضعة للإشراف مقابل غير الخاضعة للإشراف، ومكافحة التخصيص من خلال التنظيم ($L_1$/$L_2$)، والتنقل في مقايضة التحيز والتباين، ومقاييس اختيار النماذج الهيكلية، واستراتيجيات ضبط المعلمات الفائقة الآلية.
- إدارة البيانات (15%): استراتيجيات تنظيف البيانات الواقعية، وخطوط الأنابيب المتطورة لمعالجة البيانات مسبقًا، والتعامل مع البيانات المفقودة أو القيم المتطرفة، وأطر تخزين البيانات الفعالة، والبيانات القابلة للتطوير. آليات الاسترجاع.
- SQL وقاعدة البيانات (10%): معالجة متقدمة لقواعد البيانات العلائقية، وصلات معقدة متعددة الجداول، وتجميعات علائقية، ووظائف النوافذ الهيكلية، والاستعلامات الفرعية المتداخلة، وتحسين استعلام التنفيذ.
- البرمجة (10%): مفاهيم هندسة Python وR على مستوى الإنتاج، وهياكل البيانات الهيكلية، والتعقيد الخوارزمي الأساسي (قيود الوقت/المكان)، والبرمجة الموجهة للكائنات (OOP). النماذج.
- تحليل البيانات (10%): سير عمل تحليل البيانات الاستكشافية (EDA)، واستراتيجيات تصور البيانات الإعلامية، والتحليل الإحصائي الكلاسيكي، واكتشاف الأنماط من خلال استخراج البيانات، وبناء مسارات عمل النمذجة التنبؤية الأساسية.
- المعرفة بالمجال (5%): تطبيق الفطنة التجارية على الأرقام الأولية، وتحديد اتجاهات الصناعة، وإجراء تحليل السوق الكلي، وترجمة تفاعلات المستخدم إلى سلوك عملاء قابل للقياس الكمي. المقاييس.
- الاتصال وسرد القصص (5%): مهارات العرض التنفيذي، والسرد القصصي باستخدام البيانات، وآليات توليد الرؤية، وتحويل المقاييس الباردة إلى توصيات عمل استراتيجية عالية التأثير.
- أ) حدث خطأ من النوع الثاني؛ يمكن للفريق تقليل ذلك عن طريق زيادة حجم العينة الإجمالي بشكل ملحوظ.
- ب) حدث خطأ من النوع الأول؛ يمكن للفريق تقليل ذلك من خلال فرض حد أهمية أقل وأكثر صرامة مثل 0.01.
- ج) حدث خطأ من النوع الأول؛ يمكن للفريق تقليل ذلك عن طريق تمديد مدة الاختبار دون تغيير ألفا.
- د) حدث خطأ من النوع الثاني؛ يمكن للفريق تقليل ذلك عن طريق تحديد متغير اختبار غير معلمي بدلاً من ذلك.
- هـ) حدث عدم تطابق في القوة الإحصائية؛ يجب على الفريق تغيير مقياس الأداء الأساسي بالكامل.
- و) لم يحدث أي خطأ؛ تضمن القيمة p التي تقل عن الحد أن التأثير التجريبي حقيقي.
- الإجابة الصحيحة: ب
- لماذا هي صحيحة: يحدث خطأ من النوع الأول عندما ترفض عن طريق الخطأ فرضية فارغة حقيقية (إيجابية خاطئة). هنا، التأثير الحقيقي هو صفر، لكن التباين العشوائي أنتج قيمة p أقل من ألفا، مما يؤدي إلى رفض غير صحيح. الطريقة الهيكلية الوحيدة لتقليل احتمالية الخطأ من النوع الأول هي خفض عتبة أهمية ألفا ($\alpha$)، مما يقلل من الهامش المقبول للإيجابيات الكاذبة.
- لماذا الخيارات البديلة غير صحيحة:
- الخيار أ غير صحيح: يصف هذا خطأ من النوع الثاني (سلبي كاذب)، والذي يحدث عندما تفشل في رفض فرضية فارغة كاذبة.
- الخيار ج غير صحيح: مجرد تمديد مدة الاختبار دون تغيير ألفا لا يقلل من الاحتمال الصريح لخطأ من النوع الأول؛ إنه يجمع المزيد من البيانات ضمن هامش الخطأ نفسه.
- الخيار د غير صحيح: يؤدي التبديل إلى توزيعات غير معلمية إلى تغيير الافتراضات حول أشكال البيانات ولكنه لا يتحكم في سقف الخطأ الثابت من النوع الأول الذي تحدده ألفا.
- الخيار E غير صحيح: القوة الإحصائية مرتبطة بشكل صريح بأخطاء النوع الثاني ($1 - \beta$)، وليس المعدل الإيجابي الخاطئ المحدد بواسطة ألفا.
- الخيار F غير صحيح: قيمة p المنخفضة لا تضمن الواقع أبدًا؛ إنه يشير فقط إلى أن نمط البيانات المرصود من غير المرجح أن يحدث عن طريق الصدفة العشوائية وحدها في ظل افتراضات الفرضية الصفرية.
- أ) تبديل هدف الخسارة الداخلية من متوسط الخطأ المطلق (MAE) إلى متوسط الخطأ التربيعي (MSE).
- ب) زيادة معدل التعلم (معلمة الانكماش) للسماح للأشجار الفردية بالتكيف بشكل أسرع مع العينات النادرة.
- ج) تبديل هدف الخسارة الداخلية من متوسط الخطأ التربيعي (MSE) إلى خسارة هوبر القوية الوظيفة.
- د) تعطيل جميع معلمات التنظيم $L_2$ عبر هياكل شجرة القرار المكونة.
- هـ) تحويل الخوارزمية الأساسية من إطار عمل معزز إلى نموذج Random Forest الكلاسيكي غير المكرر.
- F) فرض اقتطاع صارم للبيانات عن طريق استبدال جميع العناصر الرقمية المتطرفة بقيم صفرية ثابتة.
- الإجابة الصحيحة: C
- لماذا يكون ذلك صحيحًا: تقوم MSE بتربيع الأخطاء المتبقية، مما يتسبب في توسيع نطاق تحديثات التدرج بشكل تربيعي مع وجود أخطاء كبيرة، مما يجبر النموذج على تشويه حدوده لاستيعاب القيم المتطرفة. تحل خسارة Huber هذه المشكلة من خلال التصرف بشكل تربيعي للأخطاء الصغيرة ولكن التبديل إلى عقوبة خطية للأخطاء الأكبر من عتبة محددة ($\delta$). هذا يحد من تأثير القيم المتطرفة على تدرج التحسين.
- لماذا الخيارات البديلة غير صحيحة:
- الخيار أ غير صحيح: التغيير من MAE إلى MSE سيؤدي إلى تضخيم مشكلة القيم المتطرفة بشكل كبير بسبب مكون التربيع.
- الخيار ب غير صحيح: زيادة معدل التعلم يجعل النموذج يتكيف بشكل أسرع مع أخطاء الشجرة الفردية، مما يؤدي إلى تسريع التناسب مع القيم المتطرفة.
- الخيار د غير صحيح: تؤدي إزالة التنظيم إلى زيادة تباين النموذج، مما يسمح للأشجار بالملاءمة بشكل مثالي مع القيم المتطرفة الصاخبة بدلاً من تجاهلها.
- الخيار E غير صحيح: في حين أن الغابة العشوائية تقلل التباين عن طريق المتوسط، فإن الانتقال إلى الأشجار غير المقطوعة لا يزال يسمح للمقدرين الفرديين بملاءمة الهياكل المتطرفة العميقة دون معالجة حساسية الخسارة الأساسية.
- الخيار F غير صحيح: استبدال القيم المتطرفة بشكل أعمى بقيم صفرية يفسد السلامة المادية للمعالم، مما يؤدي إلى إدخال اصطناعي شديد التحيز في توزيع البيانات.
- أ) تحويل تنسيق التخزين الفعلي من تخطيط عمودي مرة أخرى إلى مخزن الكومة التقليدي الموجه نحو الصفوف.
- ب) إسقاط كافة الفهارس المجمعة المركبة والاعتماد بشكل كامل على عمليات فحص الجدول الكامل المتوازية.
- ج) تطبيق فهرس مجمع على مفاتيح الأقسام المستخدمة في وظائف النوافذ للتخلص من عمليات الفرز الفعلية.
- د) التفاف النافذة وظائف داخل استعلامات فرعية مترابطة ومتداخلة بعمق ضمن جملة WHERE الأساسية.
- هـ) ترحيل مصفوفة البيانات بأكملها إلى مخزن مستندات ذو قيمة مفتاح غير علائقية يفتقر إلى دعم النوافذ الأصلية.
- F) تغيير بناء جملة الاستعلام لاستبدال جميع وظائف النوافذ العلائقية بصلات ذاتية داخلية صريحة على السمات غير المفهرسة.
- الإجابة الصحيحة: C
- لماذا هذا صحيح: تتطلب وظائف النافذة (OVER (PARTITION BY ... ORDER BY ...)) من محرك قاعدة البيانات فرز الصفوف الأساسية إلى مجموعات مرتبة قبل حساب التجميعات قيد التشغيل. إذا كانت البيانات الفعلية منظمة بالفعل على القرص باستخدام فهرس مجمع يتطابق تمامًا مع مفاتيح التقسيم والفرز، فسيتخطى محرك قاعدة البيانات خطوة الفرز الفعلي باهظة الثمن تمامًا، مما يقلل بشكل كبير من استخدام وحدة المعالجة المركزية وزمن وصول الإدخال/الإخراج.
- لماذا تكون الخيارات البديلة غير صحيحة:
- الخيار أ غير صحيح: أداء المتاجر الموجهة نحو الصفوف ضعيف للتجميعات التحليلية واسعة النطاق مقارنة بالتنسيقات العمودية، التي تتفوق في فحص أعمدة معينة عبر مليارات الصفوف.
- الخيار ب هو غير صحيح: يؤدي حذف الفهارس المنظمة إلى إجبار محرك التنفيذ على إجراء عمليات قراءة إدخال/إخراج عالية التكلفة لجدول كامل لكل حلقة تجميع نافذة يومية.
- الخيار D غير صحيح: تعمل الاستعلامات الفرعية المترابطة المتداخلة بشكل عميق صفًا تلو الآخر، مما يتسبب في حدوث تباطؤ أسي كارثي على الجداول الضخمة.
- الخيار E غير صحيح: يفرض عليك الانتقال إلى مخزن مستندات دون دعم أصلي سحب كافة البيانات إلى الذاكرة وحساب منطق النافذة في رمز التطبيق، وهو ما لا يفعل ذلك المقياس.
- الخيار F غير صحيح: يؤدي استبدال وظائف النافذة المبسطة بالصلات الذاتية عبر الأعمدة غير المفهرسة إلى إنشاء منتجات ديكارتية ضخمة يمكنها استنفاد ذاكرة قاعدة البيانات والمساحة المؤقتة بسرعة.
- مرحبًا بك في اختبارات أسئلة المقابلة لمساعدتك في الاستعداد لتقييم أسئلة المقابلة الخاصة بعلوم البيانات
- يمكنك إعادة إجراء الاختبارات عدة مرات كما تفعل تريد
- هذا بنك أسئلة أصلي ضخم
- يمكنك الحصول على الدعم من المدربين إذا كانت لديك أسئلة
- يحتوي كل سؤال على شرح مفصل
- متوافق مع الهاتف المحمول مع تطبيق Udemy
ما هي المتطلبات الأساسية لدخول الدورة والتسجيل فيها على موقعنا؟ رحلة التعلم:
(احصل على الدورة للدخول إلى الموقع والتسجيل)
يجب أن يكون لديك بريد إلكتروني (حساب بريد) تتذكره لنفسك وأيضًا يجب أن تتذكر كلمة مرور البريد الإلكتروني الذي ستسجل به ، وإذا لم يكن لديك حساب بريد إلكتروني ، فمن الأفضل إنشاء حساب (Gmail)
0 تعليقات
تسجيل دخول
دورات مشابهة