1
구글 나노 바나나, Gemini 2.5 Flash 이미지 모델 프리뷰 버전 공식 공개
구글 DeepMind가 Gemini-2.5-Flash-Image-Preview(코드명 'nano-banana')를 AI Studio와 Gemini API, 그리고 GEMINI 앱에서 프리뷰 버전으로 공식 공개했습니다.
이번에 공개된 프리뷰 버전은 정식 출시 전임에도 불구하고 이미 놀라운 성과를 보여주고 있습니다. Image Edit Arena에서 진행된 커뮤니티 평가에서 단 2주 만에 500만 개 이상의 투표를 이끌어내며 1위를 차지했고, 특히 이 모델 단독으로 250만 개 이상의 투표를 획득했습니다.
Arena 평가에서는 역대 최고 기록인 171점의 Elo 점수 격차로 경쟁 모델들을 압도했으며, 이는 사용자들의 높은 만족도를 객관적으로 보여주는 지표라고 할 수 있습니다.
구글이 프리뷰 버전으로 공개한 주요 기능:
최신 이미지 생성 및 편집 기술
일관된 캐릭터 표현 능력
빠른 처리 속도
현재 개발자와 얼리어답터들은 AI Studio와 Gemini API를 통해 이 프리뷰 버전을 직접 테스트해볼 수 있습니다. 구글은 프리뷰 기간 동안 수집된 피드백을 바탕으로 정식 버전을 더욱 개선할 계획으로 보입니다.
Gemini: https://gemini.google.com/
Google AI Studio: https://aistudio.google.com/
유튜브 영상: https://youtu.be/b-vCuCtanNo
2
🤖 Anthropic, 브라우저를 직접 제어하는 AI 에이전트 'Chrome용 Claude' 베타 테스트 시작
Anthropic이 웹브라우저에서 직접 작동하며 사용자를 대신해 다양한 작업을 수행할 수 있는 'Chrome용 Claude' 확장 프로그램을 공개했습니다. 현재 1,000명의 사용자를 대상으로 제한적인 연구 프리뷰 형태로 출시되었으며, Max 플랜 구독자들이 대기 목록에 등록할 수 있습니다.
📌 주요 기능
Chrome용 Claude는 단순한 챗봇을 넘어 브라우저에서 직접 다음과 같은 작업을 수행할 수 있습니다:
웹페이지 탐색 및 버튼 클릭
온라인 폼 자동 작성
기존 캘린더 이벤트에 회의실 추가
답장이 필요한 이메일 자동 검색
사용자 선호도에 맞는 아파트 검색
이는 AI가 단순히 정보를 제공하는 것을 넘어, 실제로 웹상에서 사용자를 대신해 작업을 수행할 수 있게 되었음을 의미합니다.
⚠️ 보안 위험과 대응 방안
Anthropic은 이 기능이 가져올 수 있는 보안 위험, 특히 '프롬프트 인젝션(prompt injection)' 공격의 위험성을 명확히 인지하고 있습니다. 악의적인 행위자들이 웹사이트, 이메일, 문서 등에 숨겨진 명령어를 삽입하여 AI를 조작할 수 있는 가능성이 있기 때문입니다.
잠재적 위험 시나리오:
사용자 계정이나 파일에 무단 접근
개인정보 유출
사용자 모르게 온라인 구매 진행
의도하지 않은 행동 수행
🛡️ 안전 사용 가이드라인
Anthropic은 베타 테스터들에게 다음과 같은 안전 수칙을 권고하고 있습니다:
신뢰할 수 있는 웹사이트에서만 사용
금융 거래, 비밀번호 관리 등 민감한 작업 수행 금지
중요한 작업 수행 전 반드시 검토 및 확인
예상치 못한 동작 발생 시 즉시 신고
🔮 시사점
Chrome용 Claude는 AI 에이전트의 실용적 활용 가능성을 보여주는 동시에, AI 시스템의 안전성 확보가 얼마나 중요한 과제인지를 다시 한번 상기시킵니다. 이번 제한적 베타 테스트를 통해 Anthropic은 실제 사용 환경에서 발생할 수 있는 다양한 문제점을 파악하고, 더 안전한 AI 브라우저 자동화 기술 개발을 목표로 하고 있습니다.
AI가 웹을 직접 탐색하고 조작할 수 있는 시대가 열리고 있지만, 그만큼 보안과 안전성에 대한 고민도 깊어져야 할 시점입니다.
대기 목록 신청 (Max 사용자만): https://docs.google.com/forms/d/e/1FAIpQLScc03qA6A9A0oBRNzDPn8z_QZHt-E_78ke6NmJCPIOXycvz0g/viewform

3
Cursor에 Grok Code 일주일 무료 공개
Grok Code가 이제 Cursor에서 이용 가능합니다! 일주일 동안 무료로 제공됩니다. Sonic으로 불리던 모델이 Grok Code 였네요. 윈드서프도 Grok Code를 1주일간 무료로 공개하긴 하는데 아쉽게도 pro와 Teams 사용자에게만 무료로 제공됩니다.
반면 Klio code에서는 무제한 무료로 이용할 수 있습니다. Kilo Code는 VS Code용 무료 오픈소스 AI 코딩 확장 프로그램으로, 출시 4개월 만에 24만 다운로드를 돌파했습니다.
Grok Code Fast를 무제한 무료로 이용하는 방법은 다음과 같습니다:
VS Code 마켓플레이스에서 Kilo Code를 다운로드하세요: https://marketplace.visualstudio.com/items?itemName=kilocode.Kilo-Code
20초 만에 무료 계정을 생성하세요.
하단에서 AI 모델로 "Grok Code Fast 1"을 선택하세요
무언가를 만들어 달라고 요청하세요 (예: X의 복제본 ;). 놀라움을 경험하세요:

4
Claude Code GitHub 통합 정식 출시
Anthropic이 Claude Code의 GitHub 통합 기능을 정식 출시했습니다. 이번 GA(General Availability) 버전은 단순한 @-claude 멘션을 넘어 훨씬 더 포괄적인 GitHub 이벤트 지원을 제공합니다.
🎯 주요 업데이트 내용
확장된 이벤트 트리거: 새로운 이슈 생성, CI 실패, 사용자 지정 조건 등 다양한 GitHub 이벤트에 자동으로 반응
서브에이전트 지원: 액션 내에서 더욱 정교한 작업 처리 가능
맞춤형 템플릿 제공: 코드 리뷰 등 일반적인 워크플로우를 위한 즉시 사용 가능한 템플릿 제공
💡 실제 활용 시나리오
이제 개발팀은 Claude Code를 활용해 다음과 같은 작업을 자동화할 수 있습니다:
이슈 분류 및 중복 제거 - 새로 생성된 이슈를 자동으로 분석하고 정리
CI 실패 자동 수정 - 빌드 오류를 감지하고 해결책 제시
팀 맞춤형 코드 리뷰 - 팀의 코딩 컨벤션에 맞춰 자동 리뷰 수행
PR 취약점 실시간 감지 - 새로운 풀 리퀘스트의 보안 취약점 자동 스캔
🚀 시작하기
GitHub에서 Claude Code를 시작하거나 기존 버전을 GA 버전으로 업그레이드하려면 Anthropic의 공식 문서를 참고하시기 바랍니다.
이번 업데이트는 개발 워크플로우의 자동화를 한 단계 더 발전시키며, 개발자들이 더 중요한 창의적 작업에 집중할 수 있도록 지원합니다.

5
🎨 AI 앱 개발의 새로운 전환점: Replit의 포괄적 디자인 지원 시스템
Replit이 AI 앱 개발 분야에서 획기적인 진전을 발표했습니다. 이제 개발자들이 만드는 AI 앱이 마치 전문 디자이너가 직접 작업한 것처럼 일관된 브랜드 아이덴티티를 유지할 수 있게 되었습니다.
📌 주요 업데이트 내용
1️⃣ 테마 생성 및 관리 기능 (모든 사용자 이용 가능)
색상, 폰트, UI 속성을 앱 전체에 한 번에 적용
개별 컴포넌트를 일일이 수정할 필요 없이 즉시 변환
저장된 테마를 향후 모든 앱에 원클릭으로 재사용
2️⃣ 기업용 디자인 시스템 통합 (엔터프라이즈 베타)
Figma 디자인 시스템 직접 임포트: 기존 Figma 디자인을 그대로 AI 앱에 적용
패키지/라이브러리 임포트: 디자인 토큰과 규칙을 담은 패키지 연결로 모든 앱에 일괄 적용
💡 이번 업데이트가 가져올 변화
기존에는 주로 빠른 프로토타이핑이나 내부 도구 개발에 활용되던 Replit이, 이제는 고객 대면 서비스나 상업용 앱 개발까지 가능한 플랫폼으로 진화했습니다.
여러 팀이나 용도별로 다양한 디자인 시스템을 생성하고 관리할 수 있으며, 언제든지 업데이트가 가능합니다. 현재는 새로 만드는 앱에 우선 적용되며, 기존 앱 지원도 곧 추가될 예정입니다.
더 자세한 정보는 Replit 공식 발표를 참고하세요.
AI와 디자인의 경계가 사라지는 시대, 이제 누구나 전문가 수준의 앱을 만들 수 있는 환경이 열리고 있습니다.
6
구글, 70개 언어 실시간 양방향 통역 기능 출시
구글이 Gemini 모델의 고급 추론 능력과 멀티모달 기능을 활용해 Google Translate에 두 가지 혁신적인 업데이트를 발표했습니다. 이번 업데이트는 서로 다른 언어를 사용하는 사람들 간의 소통을 한층 더 원활하게 만들어줄 전망입니다.
첫 번째 업데이트: 실시간 양방향 통역 기능
오늘부터 Translate 앱에서 "Live translate" 기능을 통해 70개 이상의 언어로 실시간 양방향 대화가 가능해집니다. 음성과 화면 번역이 동시에 제공되어 마치 통역사와 함께 있는 것처럼 자연스러운 대화를 나눌 수 있습니다. 이 기능은 이번 주부터 미국, 인도, 멕시코 사용자들에게 먼저 제공됩니다.
두 번째 업데이트: AI 기반 맞춤형 언어 학습 (베타)
구글은 사용자 개개인의 언어 학습 목표 달성을 돕는 새로운 베타 서비스도 선보입니다. Translate 앱에서 "practice" 탭을 선택한 후, 학습할 언어와 현재 실력 수준을 설정하고 학습 목표를 입력하면, AI가 맞춤형 듣기 및 말하기 연습 프로그램을 생성해줍니다.
이 기능은 이번 주부터 스페인어와 프랑스어를 학습하는 영어 사용자, 그리고 영어를 학습하는 스페인어, 프랑스어, 포르투갈어 사용자들에게 우선 제공됩니다.
이번 업데이트는 언어 장벽을 허무는 기술의 진보를 보여주는 동시에, AI가 개인화된 교육 경험을 어떻게 제공할 수 있는지를 보여주는 좋은 사례입니다. 글로벌 커뮤니케이션과 언어 학습의 미래가 어떻게 변화할지 주목해볼 만합니다.

7
Perplexity, AI 시대 출판사 수익 모델 'Comet Plus' 출시. 월 $5 구독 서비스
📰 AI 시대의 새로운 콘텐츠 비즈니스 모델이 등장했습니다
Perplexity가 오늘 'Comet Plus'라는 획기적인 구독 서비스를 발표했습니다. 이 서비스는 사용자들에게 신뢰할 수 있는 출판사와 저널리스트의 프리미엄 콘텐츠에 대한 접근권을 제공합니다.
🔄 전통적인 인터넷 경제의 한계
지금까지 출판사들은 클릭 수와 페이지뷰라는 구시대적 보상 체계에 갇혀 있었습니다. 아침 커피를 마시며 뉴스를 읽는 것은 '인간 트래픽'이고, AI에게 업계 트렌드를 요약해달라고 요청하는 것은 '인덱스 트래픽'이며, AI 어시스턴트가 일정을 확인하고 관련 기사를 추천하는 것은 '에이전트 트래픽'입니다.
각각은 실질적인 가치를 창출하지만, 기존 모델은 첫 번째 경우에만 보상을 제공했죠.
💡 Comet Plus가 제시하는 솔루션
Comet Plus는 AI 시대에 맞는 첫 번째 보상 모델입니다. 세 가지 유형의 인터넷 트래픽을 모두 인정하고 보상합니다:
인간의 직접 방문 (Human Visits)
AI의 검색 인용 (Search Citations)
AI 에이전트의 작업 수행 (Agent Actions)
구독자들은 참여 출판사의 콘텐츠에 직접 접근할 수 있고, AI 어시스턴트가 해당 사이트에서 작업을 수행할 수 있도록 권한을 부여할 수 있으며, 고품질 콘텐츠를 기반으로 한 직접적인 답변을 받을 수 있습니다.
💰 구독료와 수익 분배
월 $5의 독립 구독 서비스
Pro 및 Max 구독자에게는 무료 제공
수익의 대부분을 참여 출판사에 분배 (Perplexity의 컴퓨팅 비용 제외)
이 모델은 사용자가 정보를 소비하는 방식의 변화를 반영합니다. 수동으로 브라우징하든, AI 생성 답변을 요청하든, 복잡한 작업을 위해 에이전트를 배포하든, 출판사들은 이 새로운 현실에 맞는 보상을 받게 됩니다.

7
영화급 품질의 AI 휴먼 애니메이션이 무료로 열렸다 - Wan2.2 오픈소스 출시
🎬 영화급 휴먼 애니메이션 AI, 오픈소스로 공개되다
Wan2.2-S2V, 14B 파라미터 규모의 오디오 기반 휴먼 애니메이션 모델이 오픈소스로 공개되었습니다. 이 모델은 단순한 '말하는 얼굴' 수준을 넘어서 영화, TV, 디지털 콘텐츠 제작에 활용 가능한 프로페셔널급 품질을 구현합니다.
📌 핵심 특징
긴 영상에서도 일관된 다이나믹한 움직임 유지
영화 수준의 오디오-비디오 동기화 생성
지시문을 통한 정교한 모션 및 환경 제어
영화 제작자, 콘텐츠 크리에이터, 개발자를 위한 완벽한 솔루션
🚀 Wan2.2의 주요 혁신 기술
효율적인 MoE 아키텍처 비디오 디퓨전 모델에 Mixture-of-Experts(MoE) 아키텍처를 도입했습니다. 각 시간 단계별로 특화된 전문 모델을 활용하여, 동일한 연산 비용으로 전체 모델 용량을 대폭 확대했습니다.
영화급 미학적 품질 조명, 구도, 대비, 색조 등 세밀한 라벨링이 된 미학적 데이터를 학습했습니다. 이를 통해 사용자가 원하는 영화적 스타일을 정교하게 제어하고 맞춤형 미적 선호도에 따른 비디오 생성이 가능해졌습니다.
복잡한 모션 생성 능력 Wan2.1 대비 이미지는 65.6%, 비디오는 83.2% 더 많은 데이터로 학습했습니다. 이러한 대규모 학습을 통해 모션, 의미론, 미학 등 다양한 차원에서 일반화 성능이 크게 향상되었으며, 오픈소스 및 클로즈드 소스 모델 중 최고 성능을 달성했습니다.
효율적인 고화질 하이브리드 TI2V 16×16×4 압축 비율을 달성한 Wan2.2-VAE를 활용한 5B 모델을 오픈소스로 공개했습니다. 720P 해상도, 24fps로 텍스트-투-비디오와 이미지-투-비디오 생성을 모두 지원하며, 특히 RTX 4090 같은 소비자용 그래픽 카드에서도 구동이 가능합니다. 현재 이용 가능한 720P@24fps 모델 중 가장 빠른 속도를 자랑합니다.
💡 의미와 전망 Wan2.2의 공개는 고품질 비디오 생성 기술의 민주화를 의미합니다. 이제 독립 제작자나 소규모 스튜디오도 할리우드급 품질의 AI 기반 영상 제작이 가능해졌습니다. 특히 오픈소스로 공개되어 연구자와 개발자들이 자유롭게 활용하고 개선할 수 있다는 점에서 향후 더 큰 혁신이 기대됩니다.
Try it now : https://wan.video
Github: https://github.com/Wan-Video/Wan2.2
Project: https://humanaigc.github.io/wan-s2v-webpage
Hugging Face Demo: https://huggingface.co/spaces/Wan-AI/Wan2.2-S2V
Modelscope Demo: https://modelscope.cn/studios/Wan-AI/Wan2.2-S2V
Hugging Face Weights: https://huggingface.co/Wan-AI/Wan2.2-S2V-14B
ModelScope Weights: https://modelscope.cn/models/Wan-AI/Wan2.2-S2V-14B

오늘의 AI 뉴스는 여기까지입니다.
오늘 하루도 즐거운 하루 보내세요~!
AI 겸임교수 이종범 유튜브를 아직 구독하지 않으셨다면
https://www.youtube.com/@aiadjunct