Claude 3.5 Sonnet - 中科通讯

发展历程

当地时间2024年6月21日，Anthropic公司推出了Claude 3.5 Sonnet。Anthropic公司介绍，该模型是Claude 3.5系列模型中的首个版本，在阅读、编码、数学和视觉等几个主要AI基准测试中，新模型能力不仅超过了Claude 3 Sonnet，还超越了Anthropic此前的旗舰模型Claude 3 Opus。

产品性能

Claude 3.5 Sonnet属于中等尺寸模型，介于小型Haiku和高端Opus之间，在前代的基础上迭代升级，性能更快，编码、视觉和自然语言理解能力更强。Anthropic声称，根据内部基准测试显示，Sonnet在9个总体类别中的7个类别、5个视觉任务中的4个任务上击败了竞争对手。

Claude 3.5 Sonnet与Claude 3 Opus对比

	Claude 3.5 Sonnet	Claude 3 Opus
智能	各项基准测试中均有更高性能	表现不如3.5 Sonnet
处理速度	速度快2倍	基线速度
编码问题解决	成功率 64%	成功率38%
视觉能力	性能提高，特别是在需要视觉推理的任务中表现出色	表现不如3.5 Sonnet
自然语言理解	能理解并遵循复杂的指令能以自然、贴切的语气创作高质量的内容	表现不如 3.5 Sonnet

产品功能

功能	细分	介绍
视觉理解能力	视觉推理	Claude 3.5 Sonnet擅长解释和分析视觉数据的任务，例如：理解复杂的图表、图形和图解、分析信息图表和科学可视化、解释场景中的空间关系和背景
	图文融合	该模型可以无缝融合图像和文本的信息，实现全面的理解和分析
	物体识别	Claude 3.5 Sonnet可以准确识别和描述图像中的物体
	视觉问答	用户可以提出有关图像的问题，模型根据视觉分析提供答案
	基于图像的问题解决	Claude 3.5 Sonnet可以利用视觉信息来协助解决问题，例如分析建筑计划或工程图
	艺术与设计分析	该模型可以提供有关艺术风格、设计元素和视觉美学的见解
	手写识别	该模型展示了识别和转录手写文本的改进能力
	视觉数据提取	Claude 3.5 Sonnet可以从视觉呈现的数据（例如图像中嵌入的表格或图表）中提取相关信息
图像转录文本	处理不完美的图像	Claude 3.5 Sonnet可以从不完美的图像中转录文本，包括：图像略微模糊或失焦、光照条件较差的图像、扫描文件有些失真
	多种文本样式	该模型可以处理各种文本样式，例如：不同字体的打印文本、手写文本（清晰度不同）、风格化文本（例如徽标、艺术字体）
	多种语言	Claude 3.5 Sonnet可以转录多种语言的文本，使其适用于国际或多语言文档
	上下文理解	该模型可以理解图像中文本的上下文，帮助解释和分析
	格式保留	在转录结构化文本（如表格或表单）时，Claude 3.5 Sonnet通常可以保留或描述原始格式

产品售价

在定价上，Claude 3.5 Sonnet的输入价格为3美元/百万Tokens，输出价格为15美元/百万Tokens，上下文窗口长度达200K Tokens，价格为Claude 3 Opus的五分之一。

产品应用

Anthropic公司表示，这款产品会在Claude的web客户端设置一个专用窗口，产品形态类似于将大模型接入工作流。此外，亚马逊云科技称，Claude 3.5 Sonnet已正式接入其Amazon Bedrock。

产品评价

AI技术的不断演进中，Anthropic的Claude 3.5 Sonnet模型虽未带来翻天覆地的变化，却代表了AI模型发展的现阶段现实：在期待重大科研突破的同时，实现逐步的性能提升，即在等待重大研究突破的同时，持续进行小步快跑。近几个月，包括谷歌的Gemini 1.5 Pro和OpenAI的GPT-4o在内的旗舰产品，仅在基准测试和性能上实现了小幅提升。由于现有模型架构的局限性和训练所需的巨大计算资源，业界尚未再次见证类似从GPT-3到GPT-4的巨大飞跃。（第一财经评）