كشف الهوية أصبح أسهل بفضل وكلاء ذكاء اصطناعي جديدة تحلل أسلوب الكتابة والبيانات العامة، ما يثير تساؤلات حول خصوصية الحسابات المجهولة.
ما الذي كشفته الدراسة عن الحسابات المجهولة؟
الدراسة غير المحكّمة جاءت من باحثين في إي تي إتش زيورخ وأنثروبيك وبرنامج باحثي مواءمة نظرية التعلم الآلي، وتركز على قدرة نماذج اللغة الكبيرة على ربط المحتوى المجهول بأصحابه.
تستهدف النتائج من يستخدم حسابات بديلة في ريديت أو إكس أو إنستغرام أو جلاسدور. وقد أكد تيكبامين أن الفريق اعتمد على منشورات عامة بالكامل لتجنّب استهداف مستخدمين حقيقيين.
البيانات التي جرى تحليلها
- منشورات من ريديت قُسمت إلى مجموعتين مجهولتين لاختبار المطابقة.
- محتوى من هاكر نيوز ولينكدإن لاختبار هوية الكتّاب عبر إشارات مهنية.
- مقابلات علماء مع أنثروبيك حول استخدام الذكاء الاصطناعي.
كيف يعمل كشف الهوية بالذكاء الاصطناعي؟
النظام يبني شبكة من وكلاء الذكاء الاصطناعي تتصرف كمحققين آليين، تبحث في الويب وتجمع الأدلة ثم تقارنها بملايين الحسابات المحتملة. الفكرة الأساسية هي التعامل مع كل منشور كقرينة يمكن تتبعها.
يحلل النموذج أنماط الكتابة والتوقيت وتكرار النشر، ويطابقها مع معلومات عامة أخرى للوصول إلى قائمة مختصرة من الحسابات المرشحة.
أنواع الإشارات التي تعتمد عليها الخوارزميات
- الأسلوب اللغوي والأخطاء المتكررة في الكتابة.
- تفاصيل سيرة ذاتية متناثرة مثل التخصص أو المدينة.
- وتيرة النشر وأوقات النشاط المعتادة.
ما دقة النتائج ولماذا تختلف بين المنصات؟
التجارب أظهرت أن المنهج القائم على نماذج اللغة الكبيرة تفوق على الأساليب التقليدية التي تربط نقاط بيانات متفرقة. في بعض المجموعات وصل إلى 68% من المطابقات بدقة بلغت 90%، بينما فشلت الطرق غير المعتمدة على النماذج في العثور على أي شيء تقريباً.
الأداء لم يكن متساوياً، فكلما توفرت معلومات منظمة أو كثيرة عن المستخدم زادت فرص النجاح.
أمثلة رقمية من الاختبارات
- في مجموعات أفلام ريديت، كشف النظام الحسابات التي ذكرت فيلماً واحداً بنسبة تقارب 3% فقط.
- عند ذكر 10 أفلام أو أكثر ارتفعت نسبة المطابقة إلى نحو النصف.
- في استبيان علماء أنثروبيك، تم التعرف على 9 من أصل 125 مشاركاً تقريباً.
في أحد الأمثلة، استنتج النظام أن الإشارة إلى مشرف قد تدل على طالب دكتوراه، وأن الإنجليزية البريطانية قد تلمح إلى جهة في المملكة المتحدة، ثم قارن هذه المؤشرات بمعلومات منشورة علناً.
ماذا يعني ذلك لخصوصيتك على الإنترنت؟
هذه النتائج لا تعني نهاية كاملة للهوية المجهولة، لكنها تشير إلى أن الجمع بين النصوص العامة وذكاء البحث يمكن أن يرفع احتمالات التعرف على الأشخاص دون إذن. لذا يصبح فهم المخاطر جزءاً من أي نقاش حول الخصوصية الرقمية.
لتقليل فرص المطابقة، ينصح الباحثون بتقليل التفاصيل المتكررة وتجنب ربط نفس الأسلوب بين منصات مختلفة.
خطوات عملية للحد من الانكشاف
- تنويع الأسلوب عند الكتابة وعدم ترك سمات لغوية واضحة.
- تقليل ذكر مواقع العمل أو التخصصات الدقيقة في الحسابات الثانوية.
- مراجعة ما هو منشور علناً عنك قبل المشاركة بمعلومات حساسة.
في النهاية، يبقى كشف الهوية تحدياً متصاعداً مع تطور أدوات الذكاء الاصطناعي، ووفقاً لتيكبامين فإن الوعي بهذه المخاطر يساعد على اتخاذ قرارات نشر أكثر حذراً في 2024 وما بعدها.