本⽂介绍由清华等⾼校联合推出的⾸个开源的⼤模型⽔印⼯具包 MarkLLM★◆■★。MarkLLM 提供了统⼀的⼤模型⽔印算法实现框架、直观的⽔印算法机制可视化⽅案以及系统性的评估模块，旨在⽀持研究⼈员⽅便地实验、理解和评估最新的⽔印技术进展。通过 MarkLLM，作者期望在给研究者提供便利的同时加深公众对⼤模型⽔印技术的认知，推动该领域的共识形成，进⽽促进相关研究的发展和推⼴应⽤。

　　然⽽，就像所有新兴技术⼀样，⼤语⾔模型⽔印技术在使⽤和理解上也⾯临⼀些挑战★★◆。

　　本文由清华大学、上海交通大学、悉尼大学、UCSB◆■★★、香港中文大学、香港科技大学◆★★■◆、香港科技大学（广州）联合完成★◆■★■。主要作者包括：潘乐怡（第一作者）★◆◆，清华大学本科生，研究方向为大模型水印等◆■★◆◆■；刘瑷玮◆★◆■，清华大学博士生，研究方向为安全可信大模型等；何志威◆◆■★，上海交通大学博士生◆★★★■■，研究方向为大模型水印、大模型智能体等;高梓添，悉尼大学本科生■■★◆■，研究方向为大模型水印；赵宣栋，UCSB博士生★★■，研究方向为可信生成式AI等；胡旭明◆◆■◆■◆，香港科技大学/香港科技大学（广州）助理教授◆◆★■★，研究方向为安全可信大模型◆◆★■■、信息抽取等；闻立杰，清华大学长聘副教授，研究方向为流程挖掘，自然语言处理。

　　全⾯■■、系统的⼤模型⽔印算法评估模块：包含覆盖 3 个评估⻆度的共 12 个评估⼯具，以及两类⾃动化评估流⽔线■★■■◆◆. 设计⻆度：模块化■★■■、松耦合架构设计，具有极⾼的可扩展性和灵活性◆■★★◆。

　　各类⼤模型⽔印算法不断涌现。然⽽它们的实现⼤都基于作者⾃⾝的需求，缺乏统⼀的类和调⽤接⼝设计，使得研究⼈员和⼤众需要投⼊⼤量精⼒去使⽤和复现这些算法。

　　评估⻆度和指标多样（包含可检测性、鲁棒性、对⽂本质量的影响等），且⼀次评估涉及多步骤■■■★，全⾯快速评估算法性能极具挑战。

上一篇：登录 – 腾博国际人民币英文全称是什么？
下一篇：诺诚健华：创新药ICP-488在中重度斑块状银屑病患者中进行的Ⅱ期相关研究中取得积极的临床试验结果腾博游戏官方网站

联系我们

了解更多详细信息，请致电
400-7102-888
非工作时间服务热线
139 1323 1381
给我们留言
在线留言
微信售后服务二维码