发展历程
当地时间2024年6月21日,Anthropic公司推出了Claude 3.5 Sonnet。Anthropic公司介绍,该模型是Claude 3.5系列模型中的首个版本,在阅读、编码、数学和视觉等几个主要AI基准测试中,新模型能力不仅超过了Claude 3 Sonnet,还超越了Anthropic此前的旗舰模型Claude 3 Opus。
产品性能
Claude 3.5 Sonnet属于中等尺寸模型,介于小型Haiku和高端Opus之间,在前代的基础上迭代升级,性能更快,编码、视觉和自然语言理解能力更强。Anthropic声称,根据内部基准测试显示,Sonnet在9个总体类别中的7个类别、5个视觉任务中的4个任务上击败了竞争对手。
Claude 3.5 Sonnet与Claude 3 Opus对比
| Claude 3.5 Sonnet | Claude 3 Opus |
---|
处理速度 | 速度快2倍 | 基线速度 |
---|
编码问题解决 | 成功率 64% | 成功率38% |
---|
视觉能力 | 性能提高,特别是在需要视觉推理的任务中表现出色 | 表现不如3.5 Sonnet |
---|
自然语言理解 | 能理解并遵循复杂的指令 能以自然、贴切的语气创作高质量的内容 | 表现不如 3.5 Sonnet |
---|
产品功能
视觉理解能力 | 视觉推理 | Claude 3.5 Sonnet擅长解释和分析视觉数据的任务,例如:理解复杂的图表、图形和图解、分析信息图表和科学可视化、解释场景中的空间关系和背景 |
图文融合 | 该模型可以无缝融合图像和文本的信息,实现全面的理解和分析 |
物体识别 | Claude 3.5 Sonnet可以准确识别和描述图像中的物体 |
视觉问答 | 用户可以提出有关图像的问题,模型根据视觉分析提供答案 |
基于图像的问题解决 | Claude 3.5 Sonnet可以利用视觉信息来协助解决问题,例如分析建筑计划或工程图 |
艺术与设计分析 | 该模型可以提供有关艺术风格、设计元素和视觉美学的见解 |
手写识别 | 该模型展示了识别和转录手写文本的改进能力 |
视觉数据提取 | Claude 3.5 Sonnet可以从视觉呈现的数据(例如图像中嵌入的表格或图表)中提取相关信息 |
图像转录文本 | 处理不完美的图像 | Claude 3.5 Sonnet可以从不完美的图像中转录文本,包括:图像略微模糊或失焦、光照条件较差的图像、扫描文件有些失真 |
多种文本样式 | 该模型可以处理各种文本样式,例如:不同字体的打印文本、手写文本(清晰度不同)、风格化文本(例如徽标、艺术字体) |
多种语言 | Claude 3.5 Sonnet可以转录多种语言的文本,使其适用于国际或多语言文档 |
上下文理解 | 该模型可以理解图像中文本的上下文,帮助解释和分析 |
格式保留 | 在转录结构化文本(如表格或表单)时,Claude 3.5 Sonnet通常可以保留或描述原始格式 |
产品售价
在定价上,Claude 3.5 Sonnet的输入价格为3美元/百万Tokens,输出价格为15美元/百万Tokens,上下文窗口长度达200K Tokens,价格为Claude 3 Opus的五分之一。
产品应用
Anthropic公司表示,这款产品会在Claude的web客户端设置一个专用窗口,产品形态类似于将大模型接入工作流。此外,亚马逊云科技称,Claude 3.5 Sonnet已正式接入其Amazon Bedrock。
产品评价
AI技术的不断演进中,Anthropic的Claude 3.5 Sonnet模型虽未带来翻天覆地的变化,却代表了AI模型发展的现阶段现实:在期待重大科研突破的同时,实现逐步的性能提升,即在等待重大研究突破的同时,持续进行小步快跑。近几个月,包括谷歌的Gemini 1.5 Pro和OpenAI的GPT-4o在内的旗舰产品,仅在基准测试和性能上实现了小幅提升。由于现有模型架构的局限性和训练所需的巨大计算资源,业界尚未再次见证类似从GPT-3到GPT-4的巨大飞跃。(第一财经 评)