时间:2024-06-03 17:03:28来源:互联网
斯坦福 AI 团队发布的新模型 Llama3-V 遭指抄袭中国国产大模型 MiniCPM-Llama3-V 2.5,包括模型结构、代码和配置文件,仅变量名有所改变。证据包括直接代码对比、分词器使用和实验性特征行为的高度相似性。
Llama3-V 作者最初声称参考了 LLaVA-UHD 架构,并在面对质疑时删除了相关项目及回应。网友发现 Llama3-V 的 checkpoint 可以在 MiniCPM-Llama3-V 2.5 的代码上运行,且两者在未公开的实验性数据上表现极为相似。
尽管有部分网友认为两者间存在借鉴关系,但普遍观点认为斯坦福团队的行为超出了借鉴的范畴。目前,斯坦福团队已下架相关项目并删除回应,面壁智能 CEO 李大海也做出了正式回应。
,融易新媒体消息