2025-03-03 04:00 PM UTC+9:00

Claude 3.7 Sonet 출시: ChatGPT 이제 안녕!

vvd.im/claude-37-sonet
목록
https://vvd.im/claude-37-sonet
Anthropic은 Claude Sonnet 3.7을 출시했습니다. 이 제품은 지금까지 출시된 제품 중 가장 진보된 최신 AI 모델입니다.

이 새로운 버전은 추론 능력, 코딩 숙련도, 사용자 상호 작용을 향상시키는 획기적인 기능을 도입합니다.
하이브리드 추론, 향상된 소프트웨어 개발 지원, 에이전트 코딩을 위한 명령줄 도구를 갖춘 Claude Sonet 3.7은 AI 지원 워크플로우를 재정의할 것입니다.
Claude 3.7 Sonet 출시: ChatGPT 이제 안녕!

2025년 2월 25일에 Claude 3.7 Sonet가 출시되었습니다.

Claude 3.7 Sonnet은 이제 유료 Copilot 플랜을 사용하는 모든 고객에게 제공됩니다. 이 새로운 Sonnet 모델은 Copilot의 사고 모드와 비사고 모드를 모두 지원합니다. 초기 테스트에서 에이전트 시나리오에서 특히 강력한 개선이 이루어졌습니다.
GitHub의 내부 평가에서 이 모델은 지침을 따르고, 복잡한 작업을 세분화하고, 새로운 UI(인간 검토)를 구축하는 능력에서 이전 모델보다 개선된 것으로 나타났습니다.

우리는 Sonnet 3.5와 3.6을 사용하여 여러 개의 Java, JavaScript 기반 프로젝트의 코드를 개선하는데 몇 달을 보냈습니다. 그리고 3.7은 즉시 더 보기 좋고 더 현대적이며 개선된 코드를 제공했습니다.

이전에는 더 짧은 길이의 응답을 가진 작은 코드 조각을 제공했고 우리는 전체 코드, 더 긴 응답, 누락 없는 응답 등을 제공하도록 끊임없이 상기시켰습니다. 3.7의 답변을 통해 폴더 구조, 종속성 설치, 초기 프로젝트 설정 및 라이브러리를 생성하는 방법을 알려주었고, 그 다음에는 각각 수천 줄의 코드가 있는 각 JSX 페이지와 함께 작동하며 버그나 참조 또는 라이브러리 문제 없이 작동합니다.

개발자가 아니여도 절대 걱정할 일이 없습니다. 이제는 적절한 CSS, 애니메이션, 색상, 최신 UI를 사용하여 멋진 웹사이트를 만드는데 3분도 걸리지 않습니다.

본 기사는 Anthropic 웹 사이트에 올라온 글을 다시 재작성 하였습니다.

이전에 작성된 “ChatGPT vs Claude” 관련 기사를 읽어보시려면 여기를 클릭하세요.

 

Claude Code

Claude 3.7 Sonnet은 특히 코딩과 프론트엔드 웹 개발에서 큰 발전을 이루었습니다. 이 모델과 함께, 에이전트 코딩을 위한 명령줄 도구인 Claude Code도 소개합니다. Claude Code는 제한된 연구용 미리보기로 제공되며, 개발자들이 터미널에서 직접 Claude에게 상당한 엔지니어링 작업을 위임할 수 있도록 해줍니다.

Claude 3.7 Sonnet은 이제 무료, 프로, 팀, 엔터프라이즈 등 모든 Claude 플랜과 Anthropic API, Amazon Bedrock, Google Cloud의 Vertex AI에서 사용할 수 있습니다. 확장된 사고 모드는 무료 Claude 티어를 제외한 모든 플랜에서 사용할 수 있습니다.

표준 사고 모드와 확장 사고 모드 모두에서, Claude 3.7 Sonnet의 가격은 이전 버전과 동일합니다: 입력 토큰 1백만 개당 3달러, 출력 토큰 1백만 개당 15달러(사고 토큰 포함).

Claude 3.7 Sonnet: 프런티어 추론의 실용화

Claude는 시중의 다른 추론 모델과는 다른 철학으로 Claude 3.7 Sonnet을 개발했습니다. 인간이 빠른 반응과 깊은 사색을 위해 하나의 뇌를 사용하는 것처럼, 추론은 완전히 분리된 모델이 아니라 프런티어 모델의 통합된 기능이어야 한다고 생각합니다. 이러한 통합된 접근 방식은 사용자에게 보다 원활한 경험을 제공합니다.

Claude 3.7 Sonnet은 이 철학을 여러 가지 방식으로 구현합니다.

  • 첫째, Claude 3.7 Sonnet은 일반 LLM과 추론 모델의 두 가지 기능을 모두 갖추고 있습니다. 모델이 정상적으로 대답하기를 원하는 경우와 대답하기 전에 더 오래 생각하기를 원하는 경우를 선택할 수 있습니다. 표준 모드에서 클로드 3.7 소네트는 클로드 3.5 소네트의 업그레이드 버전입니다. 확장 사고 모드에서는 답을 찾기 전에 스스로를 반영하기 때문에 수학, 물리학, 지시 사항 따르기, 코딩, 그리고 기타 여러 작업에서 더 나은 성과를 거둘 수 있습니다. 일반적으로 모델에 대한 프롬프트는 두 모드에서 비슷하게 작동합니다.
     
  • 둘째, API를 통해 Claude 3.7 Sonnet을 사용할 때, 사용자는 사고에 대한 예산을 제어할 수 있습니다: N 토큰을 초과하지 않도록 Claude에게 지시할 수 있으며, N의 값은 출력 제한인 128,000 토큰까지 가능합니다. 이를 통해 답변의 질을 위해 속도와 비용을 절충할 수 있습니다.
     
  • 셋째, 추론 모델을 개발하는 과정에서 수학 및 컴퓨터 과학 경시대회 문제에는 그다지 최적화하지 않고, 대신 기업이 실제로 LLM을 사용하는 방식을 더 잘 반영하는 실제 작업에 초점을 맞추었습니다.

    초기 테스트에서 Claude의 코딩 능력이 전반적으로 우수하다는 사실이 입증되었습니다. Cursor는 Claude가 복잡한 코드베이스 처리부터 고급 도구 사용에 이르기까지 다양한 분야에서 상당한 개선을 보이며 다시 한 번 실제 코딩 작업에서 최고 수준임을 확인했습니다. Cognition은 코드 변경 계획과 풀스택 업데이트 처리 측면에서 다른 어떤 모델보다 훨씬 우수하다는 것을 발견했습니다. Vercel은 복잡한 에이전트 워크플로에 대한 Claude의 탁월한 정확성을 강조했고, Replit은 다른 모델이 멈춰버리는 곳에서 Claude를 성공적으로 배포하여 정교한 웹 앱과 대시보드를 처음부터 구축했습니다. Canva의 평가에서 Claude는 뛰어난 디자인 감각과 대폭 감소된 오류로 생산 준비가 완료된 코드를 일관되게 생성했습니다.

SWE-bench Verified

Claude 3.7 Sonnet은 실제 소프트웨어 문제를 해결하는 AI 모델의 능력을 평가하는 SWE-bench Verified에서 최첨단 성능을 달성했습니다.

TAU-bench

Claude 3.7 Sonnet은 사용자 및 도구 상호작용을 통해 복잡한 실제 작업에서 AI 에이전트를 테스트하는 프레임워크인 TAU-bench에서 최첨단 성능을 달성합니다.

Claude 3.7 Sonnet

Claude 3.7 Sonnet은 지시 따르기, 일반 추론, 다중 모드 기능, 에이전트 코딩에서 탁월하며, 확장된 사고는 수학 및 과학에서 두드러진 향상을 제공합니다. 전통적인 벤치마크를 넘어, 포켓몬 게임 플레이 테스트에서 이전의 모든 모델을 능가했습니다.

Claude 코드

2024년 6월부터 Sonnet은 전 세계 개발자들이 선호하는 모델이 되었습니다. Claude는 개발자들에게 더 많은 권한을 부여하기 위해, 첫 번째 에이전트 코딩 도구인 Claude 코드를 제한된 연구용 프리뷰로 출시하였습니다.
Claude 코드는 코드를 검색하고 읽을 수 있고, 파일을 편집하고, 테스트를 작성하고 실행할 수 있으며, 코드를 커밋하고 GitHub에 푸시할 수 있고, 명령줄 도구를 사용할 수 있는 능동적인 협업 도구입니다.

Claude Code는 초기 제품이지만, 없어서는 안 될 존재가 될 것입니다. 특히 테스트 중심 개발, 복잡한 문제 디버깅, 대규모 리팩토링에 유용합니다.

초기 테스트에서 Claude Code는 일반적으로 45분 이상 걸리는 수동 작업이 필요한 작업을 한 번에 완료하여 개발 시간과 오버헤드를 줄였습니다.
앞으로 몇 주 동안, 사용 현황을 바탕으로 계속해서 개선해 나갈 것이라고 합니다. (툴 호출 안정성 향상, 장기 실행 명령 지원 추가, 앱 내 렌더링 개선, 그리고 클로드의 기능에 대한 자체 이해 확대)

Claude가 Claude 코드를 통해 추구하는 목표는 개발자들이 코딩을 위해 클로드를 어떻게 사용하는지 더 잘 이해하여 향후 모델 개선에 참고하는 것입니다.

사용 가능 여부 및 가격

Claude 3.7 Sonnet을 사용하여 맞춤형 AI 솔루션을 구축하려는 개발자의 경우, Anthropic API, Amazon Bedrock, Google Cloud의 Vertex AI에서 사용할 수 있습니다.

간단한 채팅 경험을 통해 Claude 3.7 Sonnet과 협업하려는 비즈니스 사용자 및 소비자의 경우, 웹, iOS, Android의 모든 사용자를 대상으로 Claude.ai에서 Claude 3.7 Sonnet을 사용할 수 있습니다.

클로드 3.7 소네트의 가격은 입력 토큰 1백만 개당 3달러, 출력 토큰 1백만 개당 15달러부터 시작하며, 즉각적인 캐싱으로 최대 90%의 비용 절감, 일괄 처리로 50%의 비용 절감 효과를 누릴 수 있습니다. 자세한 내용은 가격 페이지를 참조하세요.

Claude와 함께 코드베이스 작업하기

Claude.ai의 코딩 환경도 개선되었습니다. 이제 모든 Claude 요금제에서 GitHub 통합 기능을 사용할 수 있습니다. 개발자는 코드 저장소를 Claude에 직접 연결할 수 있습니다.

Claude 3.7 Sonnet은 지금까지 개발된 최고의 코딩 모델입니다. 개인, 업무, 오픈 소스 프로젝트에 대한 이해가 깊어짐에 따라, 가장 중요한 GitHub 프로젝트 전반에 걸쳐 버그 수정, 기능 개발, 문서 작성에 있어 더욱 강력한 파트너가 될 것입니다.

책임감 있는 개발

Claude는 외부 전문가들과 협력하여 보안, 안전, 신뢰성 기준을 충족하는지 확인하기 위해 Claude 3.7 Sonnet에 대한 광범위한 테스트와 평가를 실시했습니다. 또한, Claude 3.7 Sonnet은 유해한 요청과 무해한 요청을 더욱 세밀하게 구분하여 이전 버전보다 불필요한 거절이 45% 감소했습니다.

이번 시스템 카드는 여러 범주에서 새로운 안전성 결과를 다루고 있으며, 다른 AI 연구소와 연구원들이 작업에 적용할 수 있는 책임 있는 확장 정책 평가에 대한 자세한 분석을 제공합니다. 이 카드는 또한 컴퓨터 사용과 관련된 새로운 위험, 특히 프롬프트 주입 공격에 대해서도 다루고 있으며, 이러한 취약성을 평가하고 클로드가 이를 저항하고 완화하도록 훈련하는 방법을 설명합니다. 또한 추론 모델의 잠재적인 안전성 이점, 즉 모델이 결정을 내리는 방식을 이해하는 능력과 모델 추론이 진정으로 신뢰할 수 있고 신뢰할 수 있는지 여부를 조사합니다.

미래를 내다보다

Claude 3.7 Sonet와 Claude는 인간의 능력을 진정으로 증강시킬 수 있는 AI 시스템을 향한 중요한 발걸음을 내딛습니다. 깊이 사고하고, 자율적으로 일하고, 효과적으로 협업할 수 있는 능력을 갖춘 그들은 AI가 인간이 성취할 수 있는 것을 풍부하게 하고 확장하는 미래에 우리를 더 가까이 데려다 줍니다.

Claude AI의 미래

새로운 기능들을 탐색하고, 그 기능들을 활용하여 어떤 결과물을 만들어 낼 수 있을지 기대가 됩니다. Claude는 계속해서 모델을 개선하고 발전시켜 나가기 위해 사용자들의 피드백을 받고있습니다.

감사합니다.

목록


박재덕
품질 관리자
박재덕은 비볼디의 품질 관리자로 사용자의 문제를 해결하고 훌륭한 서비스로 거듭나기 위해 노력하고 있습니다.
여가 시간에는 책을 읽고 가끔이지만 쇼핑을 즐기는 것을 좋아합니다.