چگونه دیپ‌فیک را تشخیص دهیم؛ حمله کلون‌ها

یاد بگیرید چگونه دیپ‌فیک‌ها را در عکس‌ها، ویدیوها، پیام‌های صوتی و تماس‌های تصویری به‌صورت real-time شناسایی کنید.

امروزه فناوری‌های ساخت ویدیو و پیام صوتی جعلی برای همه در دسترس هستند و کلاهبرداران با جدیت در حال تسلط بر هنر دیپ‌فیک‌اند. هیچ‌کس از این تهدید مصون نیست؛ شبکه‌های عصبی مدرن می‌توانند تنها با ۳ تا ۵ ثانیه صدا، صدای یک فرد را clone کنند و با چند عکس، ویدیوهایی بسیار قانع‌کننده بسازند. پیش‌تر درباره تشخیص عکس یا ویدیوی واقعی از جعلی و ردیابی زمان ثبت یا تولید آن صحبت کرده بودیم. حالا نوبت آن است که ببینیم مهاجمان چگونه دیپ‌فیک‌ها را به‌صورت real-time ایجاد و استفاده می‌کنند، چطور بدون ابزارهای forensic یک دیپ‌فیک را تشخیص دهیم و چگونه خود و اطرافیان‌مان را از «حملات کلونی» محافظت کنیم.

چگونه دیپ‌فیک ساخته می‌شود
کلاهبرداران محتوای اولیه دیپ‌فیک را از منابع عمومی جمع‌آوری می‌کنند؛ وبینارها، ویدیوهای عمومی در شبکه‌های اجتماعی و کانال‌ها، و سخنرانی‌های آنلاین. گاهی حتی به‌طور مستقیم با هدف سرقت هویت تماس می‌گیرند و سعی می‌کنند مکالمه را تا جای ممکن طولانی کنند تا داده کافی برای clone صدای باکیفیت به‌دست آورند. هک کردن اکانت پیام‌رسان فردی که عاشق پیام صوتی و ویدیویی است، jackpot واقعی برای مهاجمان محسوب می‌شود. با دسترسی به ویدیوها و پیام‌های صوتی، آن‌ها می‌توانند جعلیاتی بسازند که ۹۵٪ افراد قادر به تشخیص آن از پیام واقعی دوست یا همکارشان نیستند.

ابزارهای ساخت دیپ‌فیک دامنه گسترده‌ای دارند؛ از botهای ساده تلگرام گرفته تا generatorهای حرفه‌ای مثل HeyGen و ElevenLabs. کلاهبرداران دیپ‌فیک را با مهندسی اجتماعی ترکیب می‌کنند؛ مثلاً ابتدا تماس پیام‌رسانی را شبیه‌سازی می‌کنند که مدام قطع می‌شود، سپس یک پیام ویدیویی از پیش‌ساخته با کیفیت نه‌چندان بالا می‌فرستند و کیفیت بد را به اتصال ضعیف نسبت می‌دهند.

How to recognize a deepfake: different specular highlights in the eyes in the image on the right reveal a fake

در اغلب موارد، پیام درباره یک وضعیت اضطراری است که قربانی دیپ‌فیک فوراً به کمک نیاز دارد. طبیعتاً «دوستِ گرفتار» به پول نیاز فوری دارد، اما به‌طور اتفاقی به ATM دسترسی ندارد یا کیف پولش را گم کرده و به‌دلیل اتصال بد، انتقال آنلاین هم ممکن نیست. راه‌حل پیشنهادی واضح است؛ ارسال پول نه به خود «دوست»، بلکه به یک حساب جعلی، شماره تلفن یا cryptowallet.

این نوع کلاهبرداری‌ها معمولاً با ویدیوهای از پیش‌تولیدشده انجام می‌شوند، اما اخیراً سرویس‌های استریم دیپ‌فیک real-time هم وارد میدان شده‌اند. این سرویس‌ها امکان جایگزینی چهره فرد با چهره‌ای دیگر را در chat-roulette یا تماس ویدیویی فراهم می‌کنند.

چگونه دیپ‌فیک را تشخیص دهیم
اگر چهره‌ای آشنا همراه با صدایی قابل‌تشخیص روی صفحه می‌بینید، اما سوال‌ها یا درخواست‌ها غیرعادی هستند، احتمالاً با یک کلاهبرداری دیپ‌فیک طرفید. خوشبختانه نشانه‌های بصری، شنیداری و رفتاری مشخصی وجود دارد که حتی افراد غیرتکنیکی هم می‌توانند با آن‌ها جعلی بودن را تشخیص دهند.

نشانه‌های بصری دیپ‌فیک
مشکلات نور و سایه. دیپ‌فیک‌ها اغلب فیزیک نور را نادیده می‌گیرند؛ جهت سایه‌ها روی صورت و پس‌زمینه ممکن است با هم هم‌خوانی نداشته باشد، یا انعکاس نور روی پوست غیرطبیعی یا کاملاً غایب باشد. گاهی فرد به سمت پنجره نیم‌رخ شده، اما صورتش با نور استودیویی روشن است. این حالت برای شرکت‌کنندگان ویدیوکنفرانس‌ها آشناست، جایی که پس‌زمینه‌های جایگزین‌شده بسیار مصنوعی به نظر می‌رسند.

How to spot a deepfake: when a deepfake hand is waved in front of a deepfake face, they merge together

ویژگی‌های محو یا شناور صورت. به خط رویش مو دقت کنید؛ در دیپ‌فیک‌ها اغلب محوشدگی، flicker یا تغییر رنگ غیرطبیعی در این ناحیه دیده می‌شود. این artefactها ناشی از نقص الگوریتم در جای‌گذاری صورت clone شده روی ویدیوی اصلی هستند.

پلک‌زدن غیرطبیعی یا چشم‌های «مرده». انسان به‌طور متوسط ۱۰ تا ۲۰ بار در دقیقه پلک می‌زند. برخی دیپ‌فیک‌ها خیلی کم پلک می‌زنند و برخی بیش از حد. حرکت پلک‌ها ممکن است ناگهانی باشد یا دو چشم با هم sync نباشند. نگاه‌های شیشه‌ای یا بی‌روح نیز از نشانه‌های رایج دیپ‌فیک است. گاهی هم مردمک چشم، معمولاً فقط یکی از آن‌ها، به‌طور تصادفی twitch می‌کند که حاصل hallucination شبکه عصبی است.

در تصاویر ثابت مثل عکس، بهتر است روی چشم‌ها zoom کنید و بازتاب نور روی عنبیه‌ها را مقایسه کنید؛ در عکس واقعی این بازتاب‌ها یکسان‌اند، اما در دیپ‌فیک‌ها اغلب تفاوت دارند.

مشکلات lip-sync. حتی دیپ‌فیک‌های باکیفیت هم در هماهنگ‌سازی حرکت لب با صدا دچار مشکل می‌شوند. تاخیر صد میلی‌ثانیه‌ای هم برای چشم انسان قابل تشخیص است. هنگام تلفظ صداهایی مثل m، f یا t، ممکن است شکل لب‌ها غیرطبیعی باشد؛ نشانه‌ای واضح از صورت مدل‌سازی‌شده با AI.

پس‌زمینه ثابت یا بیش از حد محو. در ویدیوهای تولیدی، پس‌زمینه اغلب غیرواقعی است؛ بیش از حد blur شده، با چهره تعامل ندارد یا حتی هنگام حرکت دوربین کاملاً ثابت می‌ماند.

حالت‌های چهره عجیب. دیپ‌فیک‌ها در تقلید احساسات ضعیف‌اند؛ حالت صورت با جریان گفتگو تغییر نمی‌کند، لبخندها منجمد به نظر می‌رسند و چین‌وچروک‌های ظریف واقعی دیده نمی‌شوند. نتیجه صورتی است که انگار botox شده.

نشانه‌های شنیداری دیپ‌فیک
ژنراتورهای اولیه AI صدا را از phonemeهای یکنواخت می‌ساختند و تغییر لحن باعث پرش محسوس pitch می‌شد. هرچند فناوری امروز بسیار پیشرفته‌تر است، اما هنوز نشانه‌هایی وجود دارد.

لحن چوبی یا الکترونیکی. اگر صدا بیش از حد تخت و بدون نوسان طبیعی باشد یا کیفیتی الکترونیکی داشته باشد، احتمال دیپ‌فیک بالاست. گفتار واقعی پر از نوسان‌ها و نقص‌های طبیعی است.

نبود صدای نفس. انسان‌ها بین جملات نفس می‌کشند، مکث‌های ریز دارند و حتی سرفه یا sniff می‌کنند. صداهای مصنوعی اغلب فاقد این جزئیات‌اند یا آن‌ها را در جای نادرست قرار می‌دهند.

گفتار رباتیک یا قطع ناگهانی. صدا ممکن است ناگهان قطع شود، کلمات به هم «چسبیده» به نظر برسند و استرس و لحن با چیزی که از آن فرد می‌شناسید هم‌خوانی نداشته باشد.

نبود shibbolethهای گفتاری. به الگوهای گفتاری خاص فرد، مثل لهجه یا عبارات همیشگی، توجه کنید؛ دیپ‌فیک‌ها معمولاً در تقلید این جزئیات شکست می‌خورند.

برای پنهان‌کردن artefactهای بصری و شنیداری، کلاهبرداران اغلب کیفیت پایین ارتباط را شبیه‌سازی می‌کنند. یک ویدیوی noisy یا فایل صوتی بی‌کیفیت اولین پرچم قرمز است.

نشانه‌های رفتاری دیپ‌فیک
تحلیل حرکات و ظرایف رفتاری تماس‌گیرنده، همچنان قابل‌اعتمادترین راه تشخیص دیپ‌فیک در real-time است.

نمی‌تواند سرش را بچرخاند. در تماس ویدیویی از فرد بخواهید سرش را کاملاً به طرفین بچرخاند. بیشتر دیپ‌فیک‌ها با عکس و ویدیوی پرتره ساخته می‌شوند، بنابراین چرخش جانبی باعث شناورشدن، اعوجاج یا شکستن تصویر می‌شود. شرکت Metaphysic.ai سازنده دیپ‌فیک‌های معروف Tom Cruise هم تأیید می‌کند که چرخش سر در حال حاضر مطمئن‌ترین تست دیپ‌فیک است.

ژست‌های غیرطبیعی. از فرد بخواهید حرکتی ناگهانی انجام دهد؛ دستش را جلوی صورتش تکان دهد، بینی‌اش را بخاراند، جرعه‌ای آب بنوشد، چشم‌هایش را بپوشاند یا به چیزی در اتاق اشاره کند. دیپ‌فیک‌ها در ژست‌های بداهه مشکل دارند؛ دست‌ها ممکن است از اشیا یا صورت عبور کنند، انگشت‌ها تغییر شکل دهند یا حرکت غیرطبیعی داشته باشند.

اشتراک‌گذاری صفحه. اگر مکالمه کاری است، از طرف مقابل بخواهید screen share کند و یک فایل مرتبط را نشان دهد. بدون دسترسی به دستگاه واقعی همکار شما، جعل این کار تقریباً غیرممکن است.

ناتوانی در پاسخ به سوالات خاص. سوالی بپرسید که فقط خود فرد واقعی می‌داند؛ مثلاً «جلسه فردای ما چی بود؟»، «این جای زخم رو کجا برداشتم؟»، «دو سال پیش کجا رفتیم سفر؟». اگر پاسخ‌ها در چت‌های هک‌شده یا منابع عمومی نباشد، کلاهبردار گیر می‌افتد.

ندانستن کلمه رمز. با خانواده و دوستان روی یک کلمه یا عبارت محرمانه برای مواقع اضطراری توافق کنید. اگر یک خویشاوند مضطرب درخواست فوری پول کرد، کلمه رمز را بپرسید. فرد واقعی بلافاصله می‌گوید؛ کلاهبردارِ مجهز به دیپ‌فیک نه.

اگر با دیپ‌فیک مواجه شدید چه کار کنید
اگر حتی ذره‌ای شک دارید که طرف مقابل انسان واقعی نیست، این کارها را انجام دهید:

گفتگو را قطع کنید و از کانال دیگر تماس بگیرید. مطمئن‌ترین راه این است که تماس ویدیویی را قطع کنید و از طریق تماس تلفنی معمولی، پیامک یا اپ دیگر با همان فرد ارتباط بگیرید. اگر طرف مقابل ناراحت شد، وانمود کنید ارتباط قطع شده.

تحت فشار برای ارسال پول قرار نگیرید. ایجاد حس فوریت ترفند محبوب کلاهبرداران است؛ «مامان الان پول می‌خوام تصادف کردم»، «وقت توضیح ندارم»، «اگه ده دقیقه دیگه نفرستی تمومه». فرد واقعی معمولاً مشکلی با چند دقیقه صبر برای بررسی ندارد.

به دوست یا همکارتان بگویید اکانتش هک شده. اگر پیام یا تماس از شماره یا اکانت ناآشناست، خودش یک هشدار است. اما اگر دیپ‌فیک از داخل اکانت پیام‌رسان یا مخاطبان شما آمد، فوراً از کانال دیگری به او اطلاع دهید تا دسترسی‌اش را بازیابی کند و به دیگران هشدار دهد.

چگونه جلوی دیپ‌فیک شدن چهره خودتان را بگیرید
دسترسی عمومی به عکس‌ها و ویدیوهایتان را محدود کنید. پروفایل‌ها را از حالت عمومی خارج کنید، فهرست دوستان را به افراد واقعی محدود کنید و ویدیوهای دارای صدا و چهره را از دسترس عمومی حذف کنید.

به اپ‌های مشکوک دسترسی دوربین و میکروفن ندهید. کلاهبرداران می‌توانند از طریق اپ‌های جعلی داده بیومتریک جمع‌آوری کنند. استفاده از یک راهکار امنیتی معتبر all-in-one جلوی این کار را می‌گیرد.

از passkey، رمز عبور منحصربه‌فرد و 2FA استفاده کنید. حتی اگر دیپ‌فیک ساخته شود، 2FA دسترسی به اکانت‌ها را بسیار سخت‌تر می‌کند. یک password manager چندسکویی با پشتیبانی passkey و کدهای 2FA کمک بزرگی است.

به اطرافیان آموزش دهید. سالمندان، کودکان و افراد کم‌تجربه بیشترین ریسک را دارند. مثال‌های واقعی دیپ‌فیک را نشان دهید و استفاده از کلمه رمز خانوادگی را تمرین کنید.

از content analyzerها استفاده کنید. هیچ راه‌حل جادویی وجود ندارد، اما سرویس‌هایی هستند که محتوای AI-generated را با دقت بالا تشخیص می‌دهند؛ برای گرافیک Undetectable AI و Illuminarty، برای ویدیو Deepware و برای همه انواع دیپ‌فیک Sensity AI و Hive Moderation.

خونسرد بمانید. فشار روانی ابزار اصلی کلاهبرداران است. قانون طلایی را به یاد داشته باشید؛ اگر تماس، ویدیو یا پیام صوتی از هر کسی که می‌شناسید حتی کمی مشکوک بود، گفتگو را قطع کنید و از کانال دیگری ارتباط بگیرید.