法医语言学是将语言学知识应用于识别文本作者或声音背后的人。作者识别(也称为文体测量学)基于对语言使用某些模式的分析:词汇、搭配、拼写、语法等。声音识别基于语音(语音学)和声音的声学特性。
作者识别可用于确定:
语音识别可用于确定:
1、《Counteracting Forensic Linguistics》 2、《Who wrote that? (Wer schreibt denn da?)》
📌 对应的镇压战术:指控。
<aside> 🚫
如果您曾经在社交媒体或网站上公开发表过不少可追踪到您真实身份的文章/帖子,并且您担心自己不擅长掩盖语言指纹,那就请不要亲自撰写最重要的行动声明和动员令。您的团队(合作者)中应该有人擅长掩盖语言指纹,此人可作为编辑的角色在幕后合作,并且应该擅长数字最佳实践。
</aside>
<aside> <img src="/icons/merge_blue.svg" alt="/icons/merge_blue.svg" width="40px" />
</aside>
现在,LLM可以在各个平台上对你的写作风格进行指纹扫描。这是一篇近期比较惹火的论文。该论文显示,通过使用语义嵌入+推理层,可实现90% 的精确率下达到 68% 的召回率。
您以为的“匿名”帐户和您的 LinkedIn 已不再是两个独立帐户,它们现在只是模型中的两个节点。
换句话说,如果数字世界里存在关于您的近乎LinkedIn个人资料一般的真实身份信息,想要通过分身实现匿名已经非常困难。而且可能会越来越困难。
社交媒体情报从来不是新鲜事。书写习惯、措辞风格、语态节奏、标点符号、感兴趣的话题、关注者圈子,等等所有这一切,现在都在被更快速地结合在一起,形成了一个大多数人都极难保护的身份指纹。这不是现在开始的,从大数据政变实现的那年就已经开始了。只是在AI的助力下,这场噩梦正在以百万倍的速度膨胀。