یاد بگیرید چگونه دیپفیکها را در عکسها، ویدیوها، پیامهای صوتی و تماسهای تصویری بهصورت real-time شناسایی کنید.
امروزه فناوریهای ساخت ویدیو و پیام صوتی جعلی برای همه در دسترس هستند و کلاهبرداران با جدیت در حال تسلط بر هنر دیپفیکاند. هیچکس از این تهدید مصون نیست؛ شبکههای عصبی مدرن میتوانند تنها با ۳ تا ۵ ثانیه صدا، صدای یک فرد را clone کنند و با چند عکس، ویدیوهایی بسیار قانعکننده بسازند. پیشتر درباره تشخیص عکس یا ویدیوی واقعی از جعلی و ردیابی زمان ثبت یا تولید آن صحبت کرده بودیم. حالا نوبت آن است که ببینیم مهاجمان چگونه دیپفیکها را بهصورت real-time ایجاد و استفاده میکنند، چطور بدون ابزارهای forensic یک دیپفیک را تشخیص دهیم و چگونه خود و اطرافیانمان را از «حملات کلونی» محافظت کنیم.
چگونه دیپفیک ساخته میشود
کلاهبرداران محتوای اولیه دیپفیک را از منابع عمومی جمعآوری میکنند؛ وبینارها، ویدیوهای عمومی در شبکههای اجتماعی و کانالها، و سخنرانیهای آنلاین. گاهی حتی بهطور مستقیم با هدف سرقت هویت تماس میگیرند و سعی میکنند مکالمه را تا جای ممکن طولانی کنند تا داده کافی برای clone صدای باکیفیت بهدست آورند. هک کردن اکانت پیامرسان فردی که عاشق پیام صوتی و ویدیویی است، jackpot واقعی برای مهاجمان محسوب میشود. با دسترسی به ویدیوها و پیامهای صوتی، آنها میتوانند جعلیاتی بسازند که ۹۵٪ افراد قادر به تشخیص آن از پیام واقعی دوست یا همکارشان نیستند.
ابزارهای ساخت دیپفیک دامنه گستردهای دارند؛ از botهای ساده تلگرام گرفته تا generatorهای حرفهای مثل HeyGen و ElevenLabs. کلاهبرداران دیپفیک را با مهندسی اجتماعی ترکیب میکنند؛ مثلاً ابتدا تماس پیامرسانی را شبیهسازی میکنند که مدام قطع میشود، سپس یک پیام ویدیویی از پیشساخته با کیفیت نهچندان بالا میفرستند و کیفیت بد را به اتصال ضعیف نسبت میدهند.

در اغلب موارد، پیام درباره یک وضعیت اضطراری است که قربانی دیپفیک فوراً به کمک نیاز دارد. طبیعتاً «دوستِ گرفتار» به پول نیاز فوری دارد، اما بهطور اتفاقی به ATM دسترسی ندارد یا کیف پولش را گم کرده و بهدلیل اتصال بد، انتقال آنلاین هم ممکن نیست. راهحل پیشنهادی واضح است؛ ارسال پول نه به خود «دوست»، بلکه به یک حساب جعلی، شماره تلفن یا cryptowallet.
این نوع کلاهبرداریها معمولاً با ویدیوهای از پیشتولیدشده انجام میشوند، اما اخیراً سرویسهای استریم دیپفیک real-time هم وارد میدان شدهاند. این سرویسها امکان جایگزینی چهره فرد با چهرهای دیگر را در chat-roulette یا تماس ویدیویی فراهم میکنند.
چگونه دیپفیک را تشخیص دهیم
اگر چهرهای آشنا همراه با صدایی قابلتشخیص روی صفحه میبینید، اما سوالها یا درخواستها غیرعادی هستند، احتمالاً با یک کلاهبرداری دیپفیک طرفید. خوشبختانه نشانههای بصری، شنیداری و رفتاری مشخصی وجود دارد که حتی افراد غیرتکنیکی هم میتوانند با آنها جعلی بودن را تشخیص دهند.
نشانههای بصری دیپفیک
مشکلات نور و سایه. دیپفیکها اغلب فیزیک نور را نادیده میگیرند؛ جهت سایهها روی صورت و پسزمینه ممکن است با هم همخوانی نداشته باشد، یا انعکاس نور روی پوست غیرطبیعی یا کاملاً غایب باشد. گاهی فرد به سمت پنجره نیمرخ شده، اما صورتش با نور استودیویی روشن است. این حالت برای شرکتکنندگان ویدیوکنفرانسها آشناست، جایی که پسزمینههای جایگزینشده بسیار مصنوعی به نظر میرسند.

ویژگیهای محو یا شناور صورت. به خط رویش مو دقت کنید؛ در دیپفیکها اغلب محوشدگی، flicker یا تغییر رنگ غیرطبیعی در این ناحیه دیده میشود. این artefactها ناشی از نقص الگوریتم در جایگذاری صورت clone شده روی ویدیوی اصلی هستند.
پلکزدن غیرطبیعی یا چشمهای «مرده». انسان بهطور متوسط ۱۰ تا ۲۰ بار در دقیقه پلک میزند. برخی دیپفیکها خیلی کم پلک میزنند و برخی بیش از حد. حرکت پلکها ممکن است ناگهانی باشد یا دو چشم با هم sync نباشند. نگاههای شیشهای یا بیروح نیز از نشانههای رایج دیپفیک است. گاهی هم مردمک چشم، معمولاً فقط یکی از آنها، بهطور تصادفی twitch میکند که حاصل hallucination شبکه عصبی است.
در تصاویر ثابت مثل عکس، بهتر است روی چشمها zoom کنید و بازتاب نور روی عنبیهها را مقایسه کنید؛ در عکس واقعی این بازتابها یکساناند، اما در دیپفیکها اغلب تفاوت دارند.
مشکلات lip-sync. حتی دیپفیکهای باکیفیت هم در هماهنگسازی حرکت لب با صدا دچار مشکل میشوند. تاخیر صد میلیثانیهای هم برای چشم انسان قابل تشخیص است. هنگام تلفظ صداهایی مثل m، f یا t، ممکن است شکل لبها غیرطبیعی باشد؛ نشانهای واضح از صورت مدلسازیشده با AI.
پسزمینه ثابت یا بیش از حد محو. در ویدیوهای تولیدی، پسزمینه اغلب غیرواقعی است؛ بیش از حد blur شده، با چهره تعامل ندارد یا حتی هنگام حرکت دوربین کاملاً ثابت میماند.
حالتهای چهره عجیب. دیپفیکها در تقلید احساسات ضعیفاند؛ حالت صورت با جریان گفتگو تغییر نمیکند، لبخندها منجمد به نظر میرسند و چینوچروکهای ظریف واقعی دیده نمیشوند. نتیجه صورتی است که انگار botox شده.
نشانههای شنیداری دیپفیک
ژنراتورهای اولیه AI صدا را از phonemeهای یکنواخت میساختند و تغییر لحن باعث پرش محسوس pitch میشد. هرچند فناوری امروز بسیار پیشرفتهتر است، اما هنوز نشانههایی وجود دارد.
لحن چوبی یا الکترونیکی. اگر صدا بیش از حد تخت و بدون نوسان طبیعی باشد یا کیفیتی الکترونیکی داشته باشد، احتمال دیپفیک بالاست. گفتار واقعی پر از نوسانها و نقصهای طبیعی است.
نبود صدای نفس. انسانها بین جملات نفس میکشند، مکثهای ریز دارند و حتی سرفه یا sniff میکنند. صداهای مصنوعی اغلب فاقد این جزئیاتاند یا آنها را در جای نادرست قرار میدهند.
گفتار رباتیک یا قطع ناگهانی. صدا ممکن است ناگهان قطع شود، کلمات به هم «چسبیده» به نظر برسند و استرس و لحن با چیزی که از آن فرد میشناسید همخوانی نداشته باشد.
نبود shibbolethهای گفتاری. به الگوهای گفتاری خاص فرد، مثل لهجه یا عبارات همیشگی، توجه کنید؛ دیپفیکها معمولاً در تقلید این جزئیات شکست میخورند.
برای پنهانکردن artefactهای بصری و شنیداری، کلاهبرداران اغلب کیفیت پایین ارتباط را شبیهسازی میکنند. یک ویدیوی noisy یا فایل صوتی بیکیفیت اولین پرچم قرمز است.
نشانههای رفتاری دیپفیک
تحلیل حرکات و ظرایف رفتاری تماسگیرنده، همچنان قابلاعتمادترین راه تشخیص دیپفیک در real-time است.
نمیتواند سرش را بچرخاند. در تماس ویدیویی از فرد بخواهید سرش را کاملاً به طرفین بچرخاند. بیشتر دیپفیکها با عکس و ویدیوی پرتره ساخته میشوند، بنابراین چرخش جانبی باعث شناورشدن، اعوجاج یا شکستن تصویر میشود. شرکت Metaphysic.ai سازنده دیپفیکهای معروف Tom Cruise هم تأیید میکند که چرخش سر در حال حاضر مطمئنترین تست دیپفیک است.
ژستهای غیرطبیعی. از فرد بخواهید حرکتی ناگهانی انجام دهد؛ دستش را جلوی صورتش تکان دهد، بینیاش را بخاراند، جرعهای آب بنوشد، چشمهایش را بپوشاند یا به چیزی در اتاق اشاره کند. دیپفیکها در ژستهای بداهه مشکل دارند؛ دستها ممکن است از اشیا یا صورت عبور کنند، انگشتها تغییر شکل دهند یا حرکت غیرطبیعی داشته باشند.
اشتراکگذاری صفحه. اگر مکالمه کاری است، از طرف مقابل بخواهید screen share کند و یک فایل مرتبط را نشان دهد. بدون دسترسی به دستگاه واقعی همکار شما، جعل این کار تقریباً غیرممکن است.
ناتوانی در پاسخ به سوالات خاص. سوالی بپرسید که فقط خود فرد واقعی میداند؛ مثلاً «جلسه فردای ما چی بود؟»، «این جای زخم رو کجا برداشتم؟»، «دو سال پیش کجا رفتیم سفر؟». اگر پاسخها در چتهای هکشده یا منابع عمومی نباشد، کلاهبردار گیر میافتد.
ندانستن کلمه رمز. با خانواده و دوستان روی یک کلمه یا عبارت محرمانه برای مواقع اضطراری توافق کنید. اگر یک خویشاوند مضطرب درخواست فوری پول کرد، کلمه رمز را بپرسید. فرد واقعی بلافاصله میگوید؛ کلاهبردارِ مجهز به دیپفیک نه.
اگر با دیپفیک مواجه شدید چه کار کنید
اگر حتی ذرهای شک دارید که طرف مقابل انسان واقعی نیست، این کارها را انجام دهید:
گفتگو را قطع کنید و از کانال دیگر تماس بگیرید. مطمئنترین راه این است که تماس ویدیویی را قطع کنید و از طریق تماس تلفنی معمولی، پیامک یا اپ دیگر با همان فرد ارتباط بگیرید. اگر طرف مقابل ناراحت شد، وانمود کنید ارتباط قطع شده.
تحت فشار برای ارسال پول قرار نگیرید. ایجاد حس فوریت ترفند محبوب کلاهبرداران است؛ «مامان الان پول میخوام تصادف کردم»، «وقت توضیح ندارم»، «اگه ده دقیقه دیگه نفرستی تمومه». فرد واقعی معمولاً مشکلی با چند دقیقه صبر برای بررسی ندارد.
به دوست یا همکارتان بگویید اکانتش هک شده. اگر پیام یا تماس از شماره یا اکانت ناآشناست، خودش یک هشدار است. اما اگر دیپفیک از داخل اکانت پیامرسان یا مخاطبان شما آمد، فوراً از کانال دیگری به او اطلاع دهید تا دسترسیاش را بازیابی کند و به دیگران هشدار دهد.
چگونه جلوی دیپفیک شدن چهره خودتان را بگیرید
دسترسی عمومی به عکسها و ویدیوهایتان را محدود کنید. پروفایلها را از حالت عمومی خارج کنید، فهرست دوستان را به افراد واقعی محدود کنید و ویدیوهای دارای صدا و چهره را از دسترس عمومی حذف کنید.
به اپهای مشکوک دسترسی دوربین و میکروفن ندهید. کلاهبرداران میتوانند از طریق اپهای جعلی داده بیومتریک جمعآوری کنند. استفاده از یک راهکار امنیتی معتبر all-in-one جلوی این کار را میگیرد.
از passkey، رمز عبور منحصربهفرد و 2FA استفاده کنید. حتی اگر دیپفیک ساخته شود، 2FA دسترسی به اکانتها را بسیار سختتر میکند. یک password manager چندسکویی با پشتیبانی passkey و کدهای 2FA کمک بزرگی است.
به اطرافیان آموزش دهید. سالمندان، کودکان و افراد کمتجربه بیشترین ریسک را دارند. مثالهای واقعی دیپفیک را نشان دهید و استفاده از کلمه رمز خانوادگی را تمرین کنید.
از content analyzerها استفاده کنید. هیچ راهحل جادویی وجود ندارد، اما سرویسهایی هستند که محتوای AI-generated را با دقت بالا تشخیص میدهند؛ برای گرافیک Undetectable AI و Illuminarty، برای ویدیو Deepware و برای همه انواع دیپفیک Sensity AI و Hive Moderation.
خونسرد بمانید. فشار روانی ابزار اصلی کلاهبرداران است. قانون طلایی را به یاد داشته باشید؛ اگر تماس، ویدیو یا پیام صوتی از هر کسی که میشناسید حتی کمی مشکوک بود، گفتگو را قطع کنید و از کانال دیگری ارتباط بگیرید.

یک نظر