研究人员开发基于暗网数据的AI模型DarkBERT，助力网络安全威胁情报提取

AI资讯2年前 (2023)发布 GPTHub

14 0 12

根据您的要求，我将对原文进行改写，添加一些关键词并保持字数相差不大。请注意，洗稿只是一种修改文本的方式，为了避免抄袭和保护知识产权，最好在引用他人内容时进行合理的引用和注明来源。

据外媒报道，韩国的研究人员最近开发了一种名为DarkBERT的大型语言模型，该模型是基于暗网数据训练的。这一AI模型的目标是帮助网络安全专业人员从暗网中提取与网络威胁相关的情报。

DarkBERT通过研究暗网数据，可以识别和标记潜在的网络安全威胁，包括数据泄露和勒索软件。

DarkBERT是全球首个基于暗网数据集训练的AI模型，由韩国科学技术院（KAIST）的研究人员与数据情报机构S2W合作开发而成。

与ChatGPT或Bard等聊天机器人不同，DarkBERT的目标是创建一个工具，用于分析数据集并回答特定查询。DarkBERT的应用可以帮助网络安全专业人员和执法部门，通过更好地理解暗网环境中使用的语言来提供支持。

为了使DarkBERT适应暗网上使用的语言，研究人员利用Tor网络进行训练。他们通过爬取Tor网络并创建一个庞大的数据库来优化DarkBERT的性能。研究小组还采用了数据去重、数据过滤和预处理技术，以减轻与暗网内容相关的道德担忧，因为暗网内容通常包含大量敏感信息。

DarkBERT的训练过程在16天内进行了两次，其中预处理的数据包括受害组织的名称、泄露数据的详细信息、威胁声明、非法图像等内容。

由于暗网信息存在潜在风险，DarkBERT在短期内不会向公众开放。然而，用户可以提出将这一AI模型用于学术目的的请求。

文章版权归作者所有，未经允许请勿转载。

GPTHub

94 54

GPTHub

12 24

GPTHub

9 48

GPTHub

311 12

GPTHub

11 30

极客公园

8 30