1

구글의 반격 opal 공개

openai의 에이전트 빌더와 비슷한 기능을 가진 구글의 노코드 AI 미니앱 빌더 '오팔(Opal)'이 한국을 포함한 15개국에서 추가로 이용 가능해졌습니다. 또한 워크플로우용 고급 디버깅 기능도 새롭게 출시했습니다.

워크플로 고급 디버깅: 이제 시각적 편집기에서 워크플로를 단계별로 실행하거나 콘솔 패널에서 특정 단계를 반복할 수 있습니다.

Opal [Experiment]

opal.withgoogle.com

2

구글, UI를 직접 조작하는 AI 에이전트 모델 'Gemini 2.5 Computer Use' 공개

구글이 사용자 인터페이스(UI)를 직접 제어할 수 있는 새로운 AI 모델 'Gemini 2.5 Computer Use'를 공개했습니다. 이 모델은 Gemini 2.5 Pro의 시각적 이해와 추론 능력을 기반으로 구축되었으며, 웹 페이지와 애플리케이션을 사람처럼 클릭, 타이핑, 스크롤하며 조작할 수 있습니다. 현재 Google AI Studio와 Vertex AI를 통해 베타 버전으로 제공되고 있으며, 웹 및 모바일 제어 벤치마크에서 경쟁 모델 대비 우수한 성능과 낮은 지연시간을 기록했습니다.

Computer Use 모델은 화면 스크린샷과 사용자 요청을 입력받아 적절한 UI 액션(클릭, 입력 등)을 생성하고 실행하는 방식으로 작동합니다. 양식 작성, 드롭다운 메뉴 조작, 로그인이 필요한 작업 등 복잡한 디지털 태스크를 자동화할 수 있으며, 구매와 같은 고위험 작업에는 사용자 확인을 요청하는 안전 장치도 갖추고 있습니다.

구글 내부에서는 이미 UI 테스팅에 이 모델을 프로덕션 환경에 배포했으며, Project Mariner와 Firebase Testing Agent 등에도 활용되고 있습니다. 얼리 액세스 프로그램 참여자들은 개인 비서, 워크플로우 자동화, UI 테스팅 등에 이 모델을 적용해 최대 18%의 성능 향상을 경험했다고 보고했습니다.

자세한 내용: https://ai.google.dev/gemini-api/docs/computer-use#how-computer-use

GitHub - google/computer-use-preview

Contribute to google/computer-use-preview development by creating an account on GitHub.

github.com/google/computer-use-preview

3

구글 Veo 3.1 공개

Google이 최신 AI 비디오 생성 모델 Veo 3.1을 공개했습니다. Veo 3.1과 Veo 3.1 Fast는 자연스러운 음성 생성, 영화적 스타일에 대한 향상된 이해, 그리고 캐릭터 일관성 유지 등으로 개발자들이 더욱 퀄리티 높은 콘텐츠를 제작할 수 있게 해줍니다. 현재 Gemini API를 통한 유료 미리보기로 제공되고 있습니다.

Veo 3.1의 가장 주목할 만한 세 가지 신기능은 다음과 같습니다. 첫째, 참고 이미지를 최대 3개까지 제공하면 일관된 캐릭터나 장면 스타일을 유지할 수 있습니다. 둘째, Scene extension으로 기존 영상의 마지막 프레임을 기반으로 새로운 클립을 생성해 1분 이상의 긴 영상을 만들 수 있습니다. 셋째, 시작 이미지와 종료 이미지를 입력하면 그 사이의 자연스러운 전환 장면을 자동으로 생성합니다.

Google에 따르면 Promise Studios는 이미 Veo 3.1을 활용해 스토리보딩과 프리비주얼라이제이션을 제작 수준으로 개선하고 있으며, Latitude는 사용자 창작 스토리를 즉시 영상화하는 플랫폼에 통합 중입니다.

Introducing Veo 3.1 and new creative capabilities in the Gemini API- Google Developers Blog

Veo 3.1 & 3.1 Fast, new video generation models, are now in paid preview via Gemini API, offering enhanced audio, narrative control & new features.

developers.googleblog.com/en/introducing-veo-3-1-and-new-creative-capabilities-in-the-gemini-api

en-Image-Edit-2509

4

Anthropic, 최첨단 성능을 3분의 1 가격에 제공하는 Claude Haiku 4.5 공개

Anthropic이 최신 소형 모델 Claude Haiku 4.5를 공개했습니다. 주목할 점은 불과 5개월 전 최첨단 기술로 여겨졌던 Claude Sonnet 4의 코딩 성능을 3분의 1 가격과 2배 이상 빠른 속도로 구현했다는 것입니다. 가격은 백만 토큰당 입력 $1, 출력 $5로 책정되어 개발자들에게 뛰어난 비용 효율성을 제공합니다.

Claude Haiku 4.5는 단순히 저렴한 대안이 아닙니다. 컴퓨터 사용 작업에서는 Sonnet 4를 능가하는 성능을 보이며, 실시간 챗봇, 고객 서비스 에이전트, 페어 프로그래밍 등 저지연 작업에서 특히 강점을 발휘합니다. 내부 테스트 결과 GPT-5 mini보다 빠르면서도 더 뛰어난 장거리 추론과 도구 호출 능력을 갖춘 것으로 평가받고 있습니다.

Anthropic은 Sonnet 4.5와 Haiku 4.5를 함께 활용하는 새로운 접근법도 제시했습니다. Sonnet 4.5가 복잡한 문제를 다단계 계획으로 분해하면, 여러 개의 Haiku 4.5가 하위 작업을 병렬로 처리하는 방식입니다. 또한 안전성 평가에서 역대 가장 안전한 모델로 평가받아 ASL-2 등급으로 출시되었습니다. 현재 Claude API, Amazon Bedrock, Google Cloud Vertex AI를 통해 이용할 수 있습니다.

Introducing Claude Haiku 4.5

Claude Haiku 4.5, our latest small model, is available today to all users.

www.anthropic.com/news/claude-haiku-4-5

/HunyuanImage-2.1

5

Skywork AI, 전문 데이터베이스 기반 지능형 Q&A 서비스 출시

Skywork AI가 전문 데이터베이스를 기반으로 한 지능형 Q&A 서비스를 새롭게 선보였습니다. 사용자는 '새 프로젝트' 생성 시 '전문 데이터' 옵션을 선택하여 다양한 분야의 권위 있는 데이터 소스를 자유롭게 활용할 수 있게 되었습니다. 이를 통해 자신만의 맞춤형 '데이터 싱크탱크'를 구축하고, 전문적인 인사이트를 얻을 수 있습니다.

이번에 공개된 서비스의 핵심은 방대한 데이터베이스 리소스와 실시간 업데이트 기능입니다. 다양한 분야를 아우르는 광범위한 데이터 소스는 물론, 정보의 최신성과 정확성을 보장하는 실시간 업데이트 시스템을 갖추고 있습니다. 특히 주목할 점은 전문 데이터 추적 식별자를 통해 모든 답변의 출처를 명확히 하여 권위성과 검증 가능성을 확보했다는 것입니다.

이러한 기능은 AI 기반 분석 서비스의 가장 큰 과제였던 신뢰성 문제를 해결하는 중요한 진전으로 평가됩니다. 사용자들은 이제 검증된 전문 데이터를 바탕으로 더욱 신뢰할 수 있는 AI 분석 결과를 얻을 수 있게 되었습니다.

Skywork: https://skywork.ai/home?invite_code=79fe98cf749be313f919dd3f602d5298

오늘의 AI 뉴스는 여기까지입니다.

오늘 하루도 즐거운 하루 보내세요~!

AI 겸임교수 이종범 유튜브를 아직 구독하지 않으셨다면

https://www.youtube.com/@aiadjunct

[AI 겸임교수 이종범] 오늘의 뉴스 (2025.10.16)

1