1

Replit Agent 3 출시: 200분간 자율 작동하는 AI 개발자의 등장

Replit이 소프트웨어 개발의 새로운 전환점이 될 Agent 3를 공개했습니다. 이번에 출시된 Agent 3는 단순히 코드를 생성하는 것을 넘어, 브라우저를 통해 직접 앱을 테스트하고 버그를 자동으로 수정하는 '완전 자율 개발 에이전트'입니다. 200분 이상 인간의 개입 없이 자율적으로 작동하며, 버튼, 폼, 링크, API 등을 직접 확인하고 문제를 해결합니다.

특히 주목할 점은 Agent 3가 다른 AI 에이전트와 자동화 워크플로우까지 구축할 수 있다는 것입니다. Slack, Telegram 봇은 물론 Notion, Linear, SharePoint, Dropbox 등 다양한 업무 도구와 통합된 자동화를 평범한 영어로 지시하는 것만으로 구현 가능합니다. Replit은 이를 "소프트웨어 개발의 완전 자율주행(Full Self-Driving) 순간"이라고 표현했습니다.

Agent 3는 오늘부터 모든 사용자에게 순차적으로 제공되며, 독자적인 테스트 시스템은 기존 Computer Use 모델 대비 3배 빠르고 10배 더 비용 효율적이라고 합니다. 실시간 모니터링을 통해 휴대폰으로도 빌드 진행 상황을 확인할 수 있어, 개발자들이 더욱 창의적인 작업에 집중할 수 있게 되었습니다.

Replit: https://bit.ly/40W4xIh

2

구글 플레이스토어에 등장한 완전 오프라인 AI 비서, Gemma 3n

Gemma 3n이 이제 Play 스토어에서 기기 내 설치로 이용 가능하며, 음성·텍스트·이미지 입력 기능이 인터넷 없이도 작동합니다! 누구나 사용할 수 있는 오픈형 로컬 AI 어시스턴트가 출시됩니다!

기기 내 음성-텍스트 변환 및 음성-번역 텍스트 변환 기능 추가.
최대 30초 분량의 오디오 클립에 대한 일괄 추론 처리 지원.
Play 스토어에서 이용 가능, GitHub에서 오픈소스 공개
스트리밍 오디오 및 iOS 앱 출시 예정.

Repository: https://github.com/google-ai-edge/gallery

App: https://play.google.com/store/apps/details?id=com.google.ai.edge.gallery&pcampaignid=web_share&pli=1

3

3D 모션 영상을 마우스 클릭만으로 Morphic

AI가 방금 영상 편집자를 해고했습니다.

3D Motion이 방금 어떤 이미지든 영화 같은 영상으로 변환하는 가장 빠른 방법을 선보였습니다.

심도 매핑, 부드러운 카메라 움직임, 영화 같은 조명 효과로 정적인 사진을 할리우드 샷처럼 보이게 합니다.

아래 튜토리얼 + 프롬프트:

이 과정은 어이없을 정도로 간단합니다.

→ 다음 주소로 이동하세요
https://studio.morphic.com/3dmotion
→ 이미지를 업로드하세요
→ 마우스를 회전시켜 움직임을 선택하세요
→ 새로운 움직임마다 새로운 위치가 설정됩니다

4

텐센트, 2K 고화질 이미지 생성 가능한 HunyuanImage 2.1 오픈소스 공개

텐센트가 최신 텍스트-이미지 생성 모델인 HunyuanImage 2.1을 정식 출시하고 오픈소스로 공개했습니다. 이번 모델은 네이티브 2K 고화질 이미지 생성을 지원하며, 최대 1000토큰에 달하는 초장문 프롬프트를 처리할 수 있어 단일 이미지 내에서 여러 피사체를 정밀하게 제어할 수 있습니다. 특히 중국어와 영어 텍스트를 자연스럽게 이미지에 통합하는 기능이 탁월해, 제품 커버, 일러스트레이션, 포스터 디자인 등 다양한 분야에서 활용 가능합니다.

17B 파라미터를 갖춘 이 모델은 사실적인 인물 사진부터 만화, 피규어까지 다양한 스타일의 이미지를 생성할 수 있으며, 다른 모델이 1K 이미지를 생성하는 시간에 2K 초고화질 이미지를 효율적으로 만들어냅니다. 텐센트는 추론 단계를 100단계에서 8단계로 획기적으로 단축한 가속 버전과 함께, 프롬프트를 자동으로 개선해주는 업계 최초의 산업용 PromptEnhancer도 함께 오픈소스로 공개했습니다.

GitHub와 Hugging Face를 통해 모델 가중치와 데모를 무료로 이용할 수 있으며, 텐센트는 곧 네이티브 멀티모달 이미지 생성 모델도 출시할 예정이라고 밝혔습니다.

Website: https://hunyuan.tencent.com/image

Github: https://github.com/Tencent-Hunyuan/HunyuanImage-2.1

Hugging Face: https://huggingface.co/tencent/HunyuanImage-2.1

Hugging Face Demo: https://huggingface.co/spaces/tencent

/HunyuanImage-2.1

5

Manus, 분산된 업무 도구를 하나로 연결하는 AI 커넥터 출시

업무 도구가 너무 많아 이들 간 전환에 지친 직장인들에게 반가운 소식입니다. Manus가 새롭게 선보인 'Manus Connectors'는 분산된 업무 도구들을 하나의 AI 에이전트로 연결해주는 혁신적인 서비스입니다.

이 서비스의 핵심은 단순한 통합이 아닌 '지능형 연동'입니다. 예를 들어, 기업 지식베이스의 인사이트를 활용해 이메일 답장 초안을 작성하고, CRM 데이터에서 직접 광범위한 리서치를 수행할 수 있습니다. 또한 지원 티켓을 제품 백로그와 자동으로 동기화하거나, 결제 플랫폼의 송장을 재무 스프레드시트와 대조 확인하는 등 실무에서 반복되는 번거로운 작업들을 자동화합니다.

Manus Connectors는 "하나의 AI 에이전트로 모든 플랫폼을 관리한다"는 비전 아래, 도구 간 사일로 현상을 해결하고 진정한 의미의 통합 업무 환경을 구현하고자 합니다. 더 이상 여러 앱을 오가며 컨텍스트를 잃어버릴 필요가 없어진 것입니다.

6

텍스트, 이미지, 오디오를 하나로: ByteDance의 차세대 비디오 생성 AI 'HuMo'

ByteDance가 인간 중심 비디오 생성을 위한 통합 프레임워크 'HuMo'를 공개했습니다. HuMo는 단순히 텍스트와 이미지로 비디오를 생성하는 것을 넘어, 텍스트와 오디오를 결합한 음성 동기화 비디오 제작까지 가능합니다. 특히 텍스트, 이미지, 오디오를 모두 활용하여 최대한의 제어권을 제공하며, 프레임 전반에 걸쳐 일관된 주체를 유지하고 자연스러운 오디오-비주얼 동기화를 달성합니다.

이번 발표는 단순한 신제품 출시가 아닌, 완전히 제어 가능하고 일관성 있는 시네마틱 AI 비디오를 향한 중요한 진전입니다. HuMo의 등장으로 AI 비디오 생성 기술이 한 단계 더 진화하며, 창작자들에게 더욱 정교하고 전문적인 영상 제작 도구를 제공하게 되었습니다.

> 오디오, 텍스트, 이미지를 활용한 멀티 모달 컨디셔닝 기반 영상 생성
> 일관된 피사체 보존 및 동기화된 오디오 기반 동작 지원
> Wan 2.1 및 Whisper Large v3 기반
code: https://github.com/Phantom-video/HuMo

paper: https://arxiv.org/abs/2509.08519

page: https://phantom-video.github.io/HuMo/

7

MiniMax, 4분 길이 AI 음악 생성 모델 출시 - API 서비스도 오픈

MiniMax의 AI 음악 모델 'Hailuo'가 정식 출시되었습니다. 이제 개발자들은 API를 통해 최대 4분 길이의 완전한 곡을 생성할 수 있으며, 자연스러운 보컬과 함께 스타일, 분위기, 장면까지 세밀하게 제어할 수 있게 되었습니다.

특히 주목할 점은 다국어 및 다문화 지원 기능입니다. 단순한 번역을 넘어 각 문화권의 고유한 음악 스타일과 진정한 문화적 표현을 구현할 수 있어, 글로벌 음악 창작의 새로운 가능성을 열었습니다.

멜로디 생성부터 감정 표현까지, AI가 음악 창작의 전 과정을 아우르는 시대가 도래했습니다. 창작자와 개발자들에게 새로운 도구가 될 이 서비스가 음악 산업에 어떤 변화를 가져올지 귀추가 주목됩니다.

https://www.minimax.io/audio/music
api: https://www.minimax.io/platform_overview

8

프롬프트 한 줄로 웹사이트 클로닝? Open Lovable v2 출시

오픈소스 AI 소프트웨어 엔지니어 'Open Lovable v2'가 공개되었습니다. 이제 단순히 웹사이트 URL을 입력하는 것만으로도 AI 에이전트가 즉시 작동 가능한 클론 사이트를 생성해냅니다. 사용자는 이렇게 생성된 클론을 기반으로 자유롭게 추가 개발을 진행할 수 있습니다.

가장 주목할 점은 이 도구가 100% 오픈소스로 제공되며, 주요 AI 모델들과 호환된다는 것입니다. 기존의 복잡한 웹 개발 과정을 단 하나의 프롬프트로 간소화시킨 이 기술은 개발자들의 작업 효율성을 크게 향상시킬 것으로 기대됩니다. 웹사이트를 분석하고 재구축하는 AI의 능력이 실제 제품으로 구현된 사례로, 앞으로의 웹 개발 생태계에 큰 변화를 가져올 수 있을 것으로 보입니다.
https://github.com/firecrawl/open-lovable

오늘의 AI 뉴스는 여기까지입니다.

오늘 하루도 즐거운 하루 보내세요~!

AI 겸임교수 이종범 유튜브를 아직 구독하지 않으셨다면

https://www.youtube.com/@aiadjunct

[AI 겸임교수 이종범] 오늘의 뉴스 (2025.09.13)

1