语言指纹 | Notion

法医语言学是将语言学知识应用于识别文本作者或声音背后的人。作者识别（也称为文体测量学）基于对语言使用某些模式的分析：词汇、搭配、拼写、语法等。声音识别基于语音（语音学）和声音的声学特性。

作者识别

作者识别可用于确定：

语音识别可用于确定：

现在，LLM可以在各个平台上对你的写作风格进行指纹扫描。这是一篇近期比较惹火的论文。该论文显示，通过使用语义嵌入+推理层，可实现90% 的精确率下达到 68% 的召回率。

您以为的“匿名”帐户和您的 LinkedIn 已不再是两个独立帐户，它们现在只是模型中的两个节点。

换句话说，如果数字世界里存在关于您的近乎LinkedIn个人资料一般的真实身份信息，想要通过分身实现匿名已经非常困难。而且可能会越来越困难。

社交媒体情报从来不是新鲜事。书写习惯、措辞风格、语态节奏、标点符号、感兴趣的话题、关注者圈子，等等所有这一切，现在都在被更快速地结合在一起，形成了一个大多数人都极难保护的身份指纹。这不是现在开始的，从大数据政变实现的那年就已经开始了。只是在AI的助力下，这场噩梦正在以百万倍的速度膨胀。