تخطي للذهاب إلى المحتوى

تحديد المتحدث في مسجلات الذكاء الاصطناعي: كيف يعرف الذكاء الاصطناعي من قال ماذا؟

18 مارس 2026 بواسطة
تحديد المتحدث في مسجلات الذكاء الاصطناعي: كيف يعرف الذكاء الاصطناعي من قال ماذا؟
Brett G

النص المكتوب لا فائدة منه إذا كنت لا تعرف من قاله

لقد انتهيت للتو من اجتماع فريق ضم خمسة أشخاص. وقد سجل جهاز التسجيل الذي يعمل بالذكاء الاصطناعي كل كلمة بشكل مثالي. والنص المكتوب خالٍ من الأخطاء. ثم تفتحه، ولا ترى سوى جدار من النص دون أي إشارة إلى من قال ماذا.

هل وافقت سارة على زيادة الميزانية؟ أم كان ذلك مارك؟ تطوع أحدهم لإرسال الاقتراح المعدل بحلول يوم الجمعة، لكن النص المكتوب يقتصر على الكلمات دون ذكر اسم. كان الهدف الأساسي من تسجيل الاجتماع هو المساءلة، والآن عدت مرة أخرى إلى الاعتماد على ذاكرتك.

هذه هي المشكلة التي يحلها التعرف على المتحدث بالذكاء الاصطناعي. إنها الميزة التي تميز مسجل الصوت بالذكاء الاصطناعي المفيد عن جهاز التسجيل العادي. بدونه، يكون لديك نص. وبوجوده، يكون لديك سجل واضح لمن التزم بماذا، ومن أثار أي مخاوف، ومن اتخذ القرار النهائي. في الاجتماعات التي تهم فيها المساءلة، هذا الفرق هو كل شيء.

في هذا الدليل، سنشرح كيف تعمل ميزة التعرف على المتحدث بالذكاء الاصطناعي فعليًا، ولماذا هي أكثر أهمية من دقة النسخ الأولية، وكيف يتعامل مسجل Remi8 بالذكاء الاصطناعي معها بطريقة تجعل كل محضر اجتماع مفيدًا حقًا منذ لحظة إنشائه.

كيف تعمل ميزة التعرف على المتحدث بالذكاء الاصطناعي فعليًا؟

عندما يفكر معظم الناس في مسجل صوت يعمل بالذكاء الاصطناعي، يتخيلون تحويلًا بسيطًا للكلام إلى نص. لكن تحديد المتحدث، الذي يُسمى أيضًا ”تحديد المتحدث“ في العالم التقني، هو طبقة ذكاء منفصلة تمامًا. إليك ما يحدث خلف الكواليس عندما يحدد مسجل يعمل بالذكاء الاصطناعي المتحدثين المختلفين في محادثة.

الخطوة 1: تجزئة الصوت

يقوم الذكاء الاصطناعي أولاً بتحليل دفق الصوت الخام وتحديد المكان الذي يتوقف فيه شخص ما عن الكلام ويبدأ آخر. يبدو هذا بسيطًا، لكنه معقد بشكل مدهش. يقاطع الناس بعضهم بعضًا. يضحكون في منتصف الجملة. يسعلون، ويتوقفون مؤقتًا، ثم يستأنفون الكلام. تخلق الضوضاء الخلفية إشارات خاطئة. يتعين على الذكاء الاصطناعي التمييز بين التغييرات الحقيقية في المتحدثين وجميع هذه الضوضاء في الوقت الفعلي.

تستخدم أنظمة تحديد المتحدث الحديثة التي تعمل بالذكاء الاصطناعي نماذج شبكات عصبية تم تدريبها على آلاف الساعات من الصوت متعدد المتحدثين لاكتشاف هذه الانتقالات. وهي تحلل التغيرات في النغمة، واللحن، وسرعة الكلام، والطاقة الصوتية لتحديد متى بدأ شخص آخر في التحدث.

الخطوة 2: استخراج بصمة الصوت

بمجرد أن يقسم الذكاء الاصطناعي الصوت إلى دورات كلام فردية، فإنه ينشئ بصمة صوتية فريدة لكل متحدث. فكر في بصمة الصوت كبصمة إصبع لصوتك. لكل شخص مزيج مميز من الخصائص الصوتية: نطاق النغمة، وإيقاع الكلام، وأنماط الرنين، والطريقة التي ينطق بها أصواتًا معينة. يستخرج الذكاء الاصطناعي هذه الميزات ويبني ملفًا تعريفيًا رياضيًا لكل صوت يكتشفه.

وهنا تكمن أهمية جودة أجهزة التسجيل التي تعمل بالذكاء الاصطناعي. فالجهاز المزود بميكروفون واحد منخفض الجودة يلتقط إشارة صوتية مسطحة ومشوشة، مما يجعل من الصعب تمييز بصمات الصوت. أما جهاز التسجيل المزود بمصفوفة ميكروفونات متعددة الاتجاهات، مثل الأجهزة المخصصة من Remi8، فيلتقط الصوت المكاني من اتجاهات متعددة، مما يوفر للذكاء الاصطناعي بيانات أكثر ثراءً للعمل بها عند إنشاء بصمات الصوت.

الخطوة 3: التجميع والتصنيف

بعد استخراج بصمات الصوت، يقوم الذكاء الاصطناعي بتجميع جميع المقاطع التي تنتمي إلى المتحدث نفسه معًا. في كل مرة يتحدث فيها المتحدث ”أ“، يتعرف الذكاء الاصطناعي على بصمة الصوت المطابقة ويصنفها بشكل متسق في جميع أنحاء النص. والنتيجة هي تسجيل نظيف ومفصول حسب المتحدث: سارة قالت هذا، ومارك قال ذاك، والموظف الجديد الذي نسيت اسمه قال شيئًا مهمًا عند علامة 22 دقيقة.

يمكن لأنظمة تحديد المتحدث المتقدمة التي تعمل بالذكاء الاصطناعي التعامل مع الكلام المتداخل، حيث يتحدث شخصان في نفس الوقت، ويمكنها الحفاظ على الدقة حتى عندما يكون للمتحدثين أصوات متشابهة. تعمل أفضل الأنظمة، بما في ذلك نظام Remi8، على تحسين دقتها بمرور الوقت حيث تتعلم أنماط أصوات الأشخاص الذين تقابلهم بانتظام.

لماذا يعتبر تحديد المتحدث الميزة الأكثر تقديرًا في أي مسجل يعمل بالذكاء الاصطناعي؟

يركز معظم الأشخاص الذين يشترون مسجل صوت يعمل بالذكاء الاصطناعي على دقة النسخ. والدقة مهمة. ولكن إليك ما لا يخبرك به أحد: النص الذي تبلغ دقته 95 في المائة بدون تسمية المتحدثين أقل فائدة من النص الذي تبلغ دقته 90 في المائة مع تحديد واضح للمتحدثين. وإليك السبب.

تصبح المساءلة تلقائية

عندما يقول النص ”مارك: سأرسل الأرقام المنقحة اليوم“، فهذا التزام واضح لا لبس فيه. عندما يقول النص فقط ”سأرسل الأرقام المنقحة اليوم“ بدون اسم، فهذه جملة لا يتحمل مسؤوليتها أحد. تحويل تحديد المتحدث ملاحظات الاجتماع الغامضة إلى سجل للمساءلة يمكن للجميع الرجوع إليه.

القرارات قابلة للتتبع

في أي مؤسسة، معرفة من اتخذ القرار لا تقل أهمية عن معرفة ما تم اتخاذه. عندما يقوم مسجل الذكاء الاصطناعي الخاص بك بتسمية كل عبارة باسم المتحدث، يمكنك تتبع أي قرار إلى الشخص الذي اتخذه. بعد ثلاثة أشهر، عندما يسأل أحدهم ”من وافق على زيادة الميزانية؟“،الجواب موجود في النص المكتوب، مع الإشارة بوضوح إلى المصدر.

تخصيص المهام للشخص المناسب

تجمع أقوى أنظمة التسجيل الصوتي التي تعمل بالذكاء الاصطناعي بين تحديد المتحدث واستخراج المهام. فعندما يدرك الذكاء الاصطناعي أن سارة قالت: «سأحدد موعدًا لمكالمة المورد بحلول يوم الاثنين»، يمكنه تخصيص تلك المهمة مباشرةً لسارة، وتحديد موعد نهائي يوم الاثنين، وحتى صياغة تذكير. وبدون تحديد المتحدث، يمكن للذكاء الاصطناعي استخراج المهمة، لكنه لا يعرف من المسؤول عنها.

تصبح ملخصات الاجتماعات تقارير منظمة

الملخص الذي يقول ”ناقش الفريق ميزانية الربع الثالث ووافق على نفقات تسويقية إضافية“ هو ملخص عام وسهل النسيان. أما الملخص الذي يقول ”اقترحت سارة 40 ألف دولار إضافية للتسويق. وافق مارك على تحويل نفقات البنية التحتية إلى الربع الرابع لتغطية ذلك. وافق الفريق على التغيير في مراجعة يوم الجمعة“ فهو سجل منظم لما حدث ومن قام به. التعرف على المتحدث يجعل هذا ممكنًا.

يستخدم أكثر من 50,000 من المهنيين تطبيق Remi8 لكي لا يفوتهم أي تفاصيل عن الاجتماعات.

انضم إليهم واجعل كل محادثة ذات قيمة.

كيف يتعامل مسجل Remi8 المدعوم بالذكاء الاصطناعي مع تحديد المتحدث؟

تم تصميم Remi8 من الألف إلى الياء بحيث يكون تحديد المتحدث ميزة أساسية، وليس مجرد إضافة ثانوية تم تضمينها في مسجل عادي. إليك كيفية عمل النظام ولماذا يحقق نتائج أفضل من معظم البدائل الأخرى.

أجهزة مخصصة مزودة بمصفوفة ميكروفونات متعددة الاتجاهات

تعتمد معظم تطبيقات مسجلات الصوت التي تعمل بالذكاء الاصطناعي على الميكروفون الفردي لهاتفك لتسجيل صوت الاجتماعات. وقد تم تحسين هذا الميكروفون لتسجيل صوتك أثناء المكالمات الهاتفية، وليس لتسجيل أصوات ستة أشخاص حول طاولة اجتماعات. أما الأجهزة المخصصة لـ Remi8 فهي عبارة عن جهاز يزن 48 جرامًا مزود بمصفوفة ميكروفونات متعددة الاتجاهات تلتقط الصوت من كل اتجاه ضمن نطاق يبلغ 15 مترًا (49 قدمًا).

هذا التسجيل الصوتي المكاني هو ما يمنح ميزة التعرف على المتحدثين بالذكاء الاصطناعي في Remi8 ميزة كبيرة. يمكن لمصفوفة الميكروفونات اكتشاف الاتجاه الذي يأتي منه كل صوت، مما يسهل على الذكاء الاصطناعي فصل المتحدثين الفرديين والتعرف عليهم، حتى في البيئات الصاخبة. الشخص الجالس على الجانب الآخر من الطاولة له بصمة مكانية مختلفة عن الشخص الجالس بجوارك، ويستخدم Remi8 هذه المعلومات لإنشاء بصمات صوتية أكثر دقة.

الذكاء الاصطناعي الذي يتعرف على المشاركين الدائمين في اجتماعاتك

في المرة الأولى التي يسجل فيها Remi8 اجتماعًا مع مجموعة جديدة، يقوم بتسمية المتحدثين بـ ”المتحدث 1“ و”المتحدث 2“ وهكذا. ولكن هنا يكمن الذكاء: بمرور الوقت، ومع تسجيل المزيد من الاجتماعات مع نفس الأشخاص، يتعلم الذكاء الاصطناعي في Remi8 التعرف على أصواتهم تلقائيًا. بعد بضع جلسات، تبدأ النصوص في عرض الأسماء الفعلية بدلاً من التسميات العامة.

وهذا يعني أن اجتماعاتك اليومية، ومكالماتك الأسبوعية مع العملاء، واجتماعات فريقك المتكررة، كلها تنتج نصوصًا مرفقة بأسماء المتحدثين الصحيحة منذ البداية، دون أي إعداد أو تصنيف يدوي.

نصوص مفصولة حسب المتحدث مع ملخصات بالذكاء الاصطناعي

عندما يعالج Remi8 التسجيل، فإنه لا يقتصر على النسخ والتصنيف. بل يقوم بإنشاء تقرير اجتماع كامل يتضمن نصًا مفصلاً حسب المتحدث حيث يُنسب كل تصريح إلى الشخص الذي قاله، وملخصًا بالذكاء الاصطناعي منظمًا حسب موضوعات المناقشة بدلاً من الترتيب الزمني، وبنود العمل المستخرجة والمخصصة للمتحدث الصحيح مع تحديد المواعيد النهائية، والقرارات المميزة باسم الشخص الذي اتخذها.

فيما يلي مثال على شكل نص اجتماع Remi8:

المتحدث

ما قيل

سارة

نحتاج إلى الانتهاء من ميزانية الربع الثالث بحلول يوم الجمعة. طلب قسم التسويق 40 ألف دولار إضافية للحملة.

مارك

هذا ممكن إذا قمنا بتأجيل البنية التحتية إلى الربع الرابع. سأرسل الأرقام المعدلة اليوم.

سارة

ممتاز. دعونا نحددها في مراجعة يوم الجمعة.

ملخص الذكاء الاصطناعي: تم الانتهاء من ميزانية الربع الثالث لمراجعتها يوم الجمعة. تمت الموافقة على إنفاق إضافي بقيمة 40 ألف دولار للتسويق. سيقوم مارك بإرسال الأرقام المعدلة اليوم.

بنود العمل: مارك: إرسال الأرقام المعدلة للميزانية (اليوم). الفريق: إقرار ميزانية الربع الثالث في مراجعة يوم الجمعة.

كل عبارة تُنسب إلى صاحبها. كل بند عمل له مسؤول. كل قرار قابل للتتبع. هذا ما يوفره تحديد المتحدث الصحيح باستخدام الذكاء الاصطناعي.

لنتواصل

أرسل بياناتك وسيتصل بك فريقنا قريبًا.

تحديد المتحدثين خارج نطاق الاجتماعات: المكالمات الهاتفية وواتساب والمزيد

لا يقتصر تحديد المتحدثين في Remi8 على اجتماعات غرف المؤتمرات. فالذكاء الاصطناعي نفسه يعمل مع كل أنواع التسجيلات التي يلتقطها الجهاز والتطبيق.

المكالمات الهاتفية

عندما تسجل مكالمة هاتفية عبر Remi8، يقوم الذكاء الاصطناعي بتحديد صوتك وصوت المتصل بشكل منفصل. ويظهر النص الناتج تسجيلاً واضحاً للمحادثة بين المتحدثين. بالنسبة للمكالمات المبيعات ومناقشات العملاء ومفاوضات الموردين، فإن وجود نص مكالمة منفصل للمتحدثين له قيمة لا تقدر بثمن للمتابعة والمساءلة.

رسائل WhatsApp الصوتية

يمكن لـ Remi8 نسخ رسائل WhatsApp الصوتية مع الحفاظ على سياق المتحدث. إذا تلقيت رسالة صوتية طويلة من زميل، فإن النص يلتقطها ككلماته، وليس كنص عام. تصبح جزءًا من مكتبة Remi8 القابلة للبحث جنبًا إلى جنب مع ملاحظات الاجتماعات ونصوص المكالمات.

المناقشات الجماعية وجلسات العصف الذهني

جلسات العصف الذهني غير الرسمية هي المكان الذي تولد فيه أفضل الأفكار، ولكنها أيضًا المكان الذي تضيع فيه نسبة الفضل في هذه الأفكار بأسرع ما يمكن. ضع Remi8 على الطاولة أثناء جلسة على السبورة البيضاء، أو اجتماع غداء، أو محادثة في الردهة، وستقوم مجموعة الميكروفونات متعددة الاتجاهات بالتقاط صوت كل متحدث وتحديد هويته. أصبح من الممكن الآن تتبع الفكرة التي تغير خطة تطوير منتجك إلى الشخص الذي قالها.

ما الذي يميز مسجل Remi8 بالذكاء الاصطناعي عن البدائل القائمة على التطبيقات؟

هناك الكثير من تطبيقات مسجلات الصوت بالذكاء الاصطناعي التي تدعي أنها قادرة على تحديد المتحدث. إليك الأسباب التي تجعل جهازًا مخصصًا مثل Remi8 ينتج نتائج أفضل بكثير:

القدرات

مسجل Remi8 بالذكاء الاصطناعي

تطبيقات الذكاء الاصطناعي القائمة على الهات

جودة الميكروفون

مصفوفة ميكروفونات متعددة الاتجاهات، نطاق 15 مترًا

ميكروفون هاتف واحد، نطاق محدود

صوت مكاني لتحديد هوية المتحدث

نعم، يكتشف اتجاه الصوت

لا، صوت أحادي مسطح

تأثير على البطارية

طارية مخصصة تدوم 30 ساعة

يستنزف بطارية هاتفك

انقطاعات أثناء التسجيل

ا شيء، جهاز مخصص

لمكالمات والإشعارات تعطل التسجيل

تعلم المتحدثين بمرور الوقت

يتعلم المشاركين المنتظمين

معظمها يبدأ من الصفر في كل جلسة

لتسجيل دون اتصال بالإنترنت

سعة تخزين محلية 64 جيجابايت، لا حاجة إلى شبكة Wi-Fi

معظمها يتطلب الإنترنت

بنود العمل مع أسماء المتحدثين

تم تخصيصها تلقائيًا للشخص المناسب

ستخراج عام بدون أسماء

الخصوصية

تشفير من طرف إلى طرف، معالجة على الجهاز

يعتمد على السحابة، البيانات على خوادم خارجية

الوزن وسهولة الحمل

48 جرامًا، يتسع في الجيب

هاتفك، الذي تحتاجه لمهام أخرى

السعر

يبدأ من حوالي 84 دولارًا (لمرة واحدة)

شتراك مجاني إلى 20 دولارًا شهريًا

يكمن الاختلاف الأساسي في الغرض. هاتفك هو جهاز متعدد الأغراض يقوم بمئات المهام في وقت واحد. Remi8 هو مسجل ذكاء اصطناعي مصمم خصيصًا للقيام بمهمة واحدة بشكل استثنائي: التقاط كل الأصوات في الغرفة وتحديدها ونسخها وفهمها.

هل أنت مستعد لأن لا تنسى تفاصيل الاجتماعات أبدًا؟

انضم إلى آلاف الأشخاص المشغولين الذين يثقون في Remi8 باعتباره «عقلهم الثاني»

 

بدء مجاني | عقلك الثاني الشخصي

أفضل مسجل يعمل بالذكاء الاصطناعي لا يكتفي بسماع الكلمات فحسب، بل يعرف من قالها.

تعد ميزة النسخ النصي أمرًا أساسيًا. ففي عام 2026، سيكون بإمكان كل مسجل صوت يعمل بالذكاء الاصطناعي تحويل الكلام إلى نص. لكن القيمة الحقيقية، والميزة التي تحول التسجيل من مجرد ملف نصي إلى نظام للمساءلة، هي ميزة التعرف على المتحدث باستخدام الذكاء الاصطناعي. إن معرفة من قال ماذا يغير كل شيء: فتصبح المهام المحددة مسؤولة عن أشخاص محددين، وتصبح القرارات قابلة للتتبع، وتصبح ملخصات الاجتماعات تقارير منظمة بدلاً من فقرات عامة.

تم تصميم Remi8 من الألف إلى الياء لحل هذه المشكلة. جهاز مخصص يزن 48 جرامًا مزود بمجموعة ميكروفونات متعددة الاتجاهات يلتقط الصوت المكاني مما يجعل تحديد المتحدث أكثر دقة بشكل كبير من أي تطبيق يعمل على الهاتف. يتعلم الذكاء الاصطناعي المشاركين الدائمين في اجتماعاتك بمرور الوقت. تظهر النصوص مع أسماء المتحدثين، والمهام الموكلة إلى الأشخاص المناسبين، والقرارات المنسوبة إلى الشخص الذي اتخذها.

اجتماعاتك مليئة بالقرارات التي تستحق التذكر. تأكد من أن مسجلك يعرف من اتخذها.