巴西法律大语言模型Juru的技术解析

本文介绍基于Mistral-7B架构的巴西法律领域大语言模型Juru,通过19亿高质量法律文本的领域专业化训练,在减少预训练数据量的同时提升法律任务性能,并分析其跨领域知识遗忘现象。

大语言模型正则化微调去毒技术解析

本文提出通过属性控制微调方法使大语言模型在保持基准性能的同时降低毒性输出,采用并行化算法提升训练效率,实验证明该方法在毒性控制和生成质量上优于传统强化学习与过滤方案。

AI训练负载均衡算法性能研究

本文评估了大规模AI训练任务在专用基础设施上运行时,不同负载均衡算法的性能表现,同时探讨了拥塞控制和丢包恢复算法的设计选择对系统性能的影响。

深入iOS安全与编译器理论:MAST移动应用安全工具包解析

本文介绍Sophia D'Antoine在Etsy Code as Craft技术讲座中分享的iOS安全前沿技术,包括MAST工具包如何整合越狱检测、反调试和基于LLVM的反逆向工程功能,为高风险应用提供超越苹果原生API的保护方案。