Down the Rabbit Hole: Unusual Applications of OpenAI in Cybersecurity Tooling

引言

随着AI技术进入成熟应用期，网络安全领域的低垂果实已被采摘——杀毒引擎集成机器学习模型，攻击者滥用合成媒体实施诈骗。尽管存在炒作和恐吓，OpenAI的GPT-3语言模型仍因其在Black Hat和DEF CON大会上展示的钓鱼工具/反钓鱼工具引发广泛关注。

Lambda Labs数据显示，GPT-3 API相较前代实现百倍级参数增长：

指标	GPT-2	GPT-3	GPT-3 API
训练时间	1+周	355年	<1分钟
成本	$43k	$4.6m	$0.06/千token
数据量	40GB	45TB	可忽略
算力需求	32个TPUv3	1个Tesla V100	可忽略

OpenAI推出两大代码相关产品：

早期测试显示GPT-3具备出色的代码解析能力。例如输入JavaScript代码：

1
2


var minions = ["Bob", "Kevin", "Stuart"];
console.log(minions);

模型能准确解释为：“该代码初始化包含三个名字的数组，然后将数组打印到控制台”。

作者尝试将GPT-3应用于汇编代码逆向工程。以Metasploit的RC4加密payload为例：

原始模型表现：将RC4密钥调度算法误判为"打印HELLO WORLD"
改进方法：
- 使用fine-tuning功能在Curie模型上训练
- 构建包含100个Metasploit payload的训练集（50个RC4/50个未加密）
- 训练耗时仅5分钟

测试结果：

使用davinci-instruct模型进行漏洞检测：

1
2
3
4


@app.route('/search')
def search():
    query = request.args.get('q')
    return render_template('results.html', query=query)

模型成功识别出XSS漏洞，并准确定位到危险参数q。

随着GPT-3访问权限放宽，预计将涌现更多AI驱动的安全工具，如：

（全文完）