ما هو التعرف على الصور المدعوم من التعلم العميق؟

ما هو التعرف على الصور المدعوم من التعلم العميق؟

يتم مشاركة أكثر من ملياري صورة كل يوم في الشبكات الاجتماعية. تظهر الأبحاث أن الأمر قد يستغرق عشر سنوات لإلقاء نظرة على جميع الصور التي تمت مشاركتها على Snapchat في الساعة السابقة! هذه مهمة شاقة إلى حد بعيد وتتجاوز القدرات البشرية.

يواجه مشترو ومزودو الوسائط صعوبة في تنظيم المحتوى القابل للتطبيق في مجموعات ، وتحليل مكونات الصور / مقاطع الفيديو ، وتحديد عائد الاستثمار من المقالات التي تم إنشاؤها بطريقة فعالة. لطالما كان الحصول على رؤى (مثل البيانات الوصفية ، والمقالات ، والفئات ، واللون ، وما إلى ذلك) من الوسائط الغنية - بسرعة ودقة وآلية - يمثل تحديًا لفترة طويلة.

فيما يلي المصطلحات الرئيسية ذات الصلة بالتعرف على الصور:

  • التعلم الآلي (ML) هو نهج موجه لتحقيق الذكاء الاصطناعي. إنها تسمح لنا بتبني الذكاء بالحسابات وهي كلمة طنانة يسمعها الناس كل يوم. يستخدم ML الخوارزميات لتحليل البيانات والتعلم منها وحتى المساعدة في التنبؤ بالنتائج.

  • يستحوذ التعلم العميق ، وهو مجموعة فرعية من ML أو تقنية لتنفيذ ML ، على القطاعات بسرعة حيث يستخدم المطورون قدرة الأنظمة العصبية على اكتشاف الأفكار. يعد اكتشاف الأنماط تلقائيًا بدون ميزات الترميز اليدوي للإنسان هو الكأس المقدسة الجديدة.
  • تمكن رؤية الكمبيوتر أجهزة الكمبيوتر من تحديد الصور باستخدام المستشعرات ومعالجات الصور لمطابقة قدرات العين الفردية. هناك تداخل طفيف بين ML و CV (انظر الرسم البياني أعلاه). أصبحت السيرة الذاتية مهمة لأنها تساعد في معالجة العدد المذهل من الصور المرئية التي يتم إنشاؤها كل يوم.

  • معالجة الصور هي طريقة للقيام ببعض العمليات (التحسين أو الضغط) في صورة ما لاستخراج معلومات قيمة. يمكن استخدام ML في كل من رؤية الكمبيوتر ومعالجة الصور.
  • التعرف على الصور هو مجرد مصطلح آخر لتوضيح الإجراء الخاص بتحديد واكتشاف عنصر أو ميزة في مقاطع الفيديو أو الصور. هناك أشخاص يعتقدون أن رؤية الكمبيوتر تشبه تمامًا التعرف على الصور ، لكن رؤية الكمبيوتر الشخصي أوسع بشكل كبير وتتضمن التعرف الموضوعي ، والتعرف على الأحرف ، وتحليل النص / المشاعر. من الطبيعي ربط التعرف على الصور باكتشاف الوجه ، ولكن هناك المزيد. كمثال ، فيما يلي بعض السمات الرئيسية التي يوفرها النظام البيئي الرائد في تقديم حل التعرف على الصور ومعالجة الصور المدعوم بالتعلم العميق:
    • تصنيف / تصنيف المشاهد - تصنيف الصور تلقائيًا ؛ على سبيل المثال ، فرز صورنا الشخصية. على الرغم من ذلك ، فإن إحدى أقوى إمكانيات Imagga هي إعداد مصنف خاص لحالة استخدام محددة وعمودي ، بدءًا من الصور الشخصية إلى تعريف المصنع وفرز القمامة.
    • البحث عن التشابه البصري - توقيعات ضخ للصور في مجموعة تسمح بالبحث فيما بينها بناءً على التشابه المرئي و / أو الدلالي في المستقبل ، وكذلك تقترح الصور / المنتجات المماثلة.
    • ندرك أن الكائن الرئيسي - تحديد الكائن الرئيسي في الصورة.
    • التعرف على الوجوه - اكتشف الوجوه وحشدها في أشخاص افتراضيين ، يمكن استخدامها لتحسين تنظيم الصور الخاصة ومراقبة الوسائط المجتمعية.

    • وضع العلامات تلقائيًا على الصور - قم بتمييز العديد من العناصر بعبارات رئيسية مختلفة للمساعدة في فرز الصور و / أو استخراج الإحصائيات.

    • تحليل التركيب - اكتشف تلقائيًا المناطق الأكثر تشويقًا من الناحية المرئية في الصور ، ثم قم في النهاية بتمكين الاقتصاص الذكي لمناطق الانتباه هذه.
    • استخراج الألوان - تحديد الألوان التمثيلية في الرسومات ، بما في ذلك التعرف المنفصل على ألوان المقدمة والخلفية عند الاقتضاء.