206건 수집
2026-04-18 00:17

오늘의 핵심

클로드 오푸스 4.7

해커뉴스 (1822포인트, 1315댓글)

Hacker News

🤖 모델 & 제품 (12건)

Google 2026-04-17

Google의 도움으로 올여름 더욱 스마트하게 여행하는 7가지 방법

해변 마을의 물가 농산물 직판장에서 Pixel 휴대전화를 들고 있는 사람을 보여주는 그림

Google AI Blog
OpenAI 2026-04-16

(거의) 모든 것에 대한 코덱스

macOS 및 Windows용으로 업데이트된 Codex 앱에는 컴퓨터 사용, 앱 내 탐색, 이미지 생성, 메모리 및 플러그인이 추가되어 개발자 작업 흐름을 가속화합니다.

비전
OpenAI Blog
OpenAI 2026-04-16

생명과학 연구를 위한 GPT-Rosalind를 소개합니다

OpenAI는 약물 발견, 유전체학 분석, 단백질 추론 및 과학 연구 워크플로우를 가속화하기 위해 구축된 개척 추론 모델인 GPT-Rosalind를 소개합니다.

OpenAI연구
OpenAI Blog
OpenAI 2026-04-16

우리 모두를 보호하는 사이버 방어 생태계 가속화

선도적인 보안 회사와 기업이 OpenAI의 Trusted Access for Cyber에 합류하여 GPT-5.4-Cyber ​​및 1천만 달러의 API 보조금을 사용하여 글로벌 사이버 방어를 강화합니다.

OpenAI
OpenAI Blog
Google 2026-04-16

Chrome의 AI 모드로 웹을 탐색하는 새로운 방법

Chrome의 AI 모드

Google AI Blog
Google 2026-04-16

Gemini 앱에서 개인화된 이미지를 만드는 새로운 방법

Personal Intelligence로 만든 예시 이미지

Google비전
Google AI Blog

🌎 업계 동향 (105건)

Community 2026-04-17

클로드 디자인

해커 뉴스(995포인트, 댓글 656개)

Claude
Hacker News
Community 2026-04-17

Claude 4.7의 토크나이저 비용 측정

해커 뉴스(593포인트, 415댓글)

Claude가격
Hacker News
Community 2026-04-17

여러 고위 경영진이 사임을 발표하면서 OpenAI의 "해방의 날"

해커 뉴스(9 포인트, 0 댓글)

OpenAI
Hacker News
Community 2026-04-17

문을 닫은 스타트업은 오래된 Slack 채팅과 이메일을 AI 회사에 판매하고 있습니다.

해커 뉴스(6포인트, 댓글 2개)

Hacker News
News 2026-04-17

Kevin Weil과 Bill Peebles는 회사가 계속해서 '사이드 퀘스트'를 중단함에 따라 OpenAI를 종료합니다.

Kevin Weil과 Bill Peebles는 회사가 Sora를 종료하고 과학 팀을 접으면서 OpenAI를 떠나 소비자 문샷에서 엔터프라이즈 AI로의 급격한 전환을 알립니다.

OpenAI
TechCrunch AI
News 2026-04-17

Tokenmaxxing, OpenAI의 흥청망청 쇼핑 그리고 AI Anxiety Gap

AI 내부자와 다른 모든 사람 사이의 격차가 벌어지고 있으며 지출, 의심, 심지어 새로운 어휘까지 이를 보여주기 시작했습니다. OpenAI가 '금융 앱'부터 토크쇼까지 모든 것을 사들이느라 분주한 가운데, 어느 신발 회사는 방금 AI 인프라 플레이로 브랜드를 바꿨고, Anthropic은 공개적으로 출시하기에는 너무 강력하다고 말하는 모델을 공개했습니다.

AnthropicOpenAI
TechCrunch AI

📚 논문 & 연구 (84건)

arXiv 2026-04-16

MM-WebAgent: 웹 페이지 생성을 위한 계층적 다중 모달 웹 에이전트

AIGC(인공 지능 생성 콘텐츠) 도구의 급속한 발전으로 웹 페이지 디자인에 대한 요구에 따라 이미지, 비디오 및 시각화를 생성할 수 있으며, 최신 UI/UX에 유연하고 점점 더 많이 채택되는 패러다임을 제공합니다. 그러나 이러한 도구를 자동화된 웹 페이지 생성에 직접 통합하면 요소가 생성됨에 따라 스타일 불일치와 열악한 전역 일관성이 발생하는 경우가 많습니다.

에이전트비전
arXiv (cs.AI)
arXiv 2026-04-16

LLM 문제 해결의 일반화: 최단 경로 사례

언어 모델이 체계적으로 일반화될 수 있는지 여부는 여전히 활발하게 논의되고 있습니다. 그러나 경험적 성능은 훈련 데이터, 훈련 패러다임, 추론 시간 전략과 같은 여러 요인에 의해 공동으로 형성되므로 실패를 해석하기 어렵습니다. 표준 컴포저블 순차 최적화 문제인 최단 경로 계획을 기반으로 제어된 합성 환경을 소개합니다. s

arXiv (cs.AI)
arXiv 2026-04-16

LLM 판사 신뢰성 진단: 등각 예측 세트 및 전이성 위반

LLM-판사 프레임워크는 자동 NLG 평가에 점점 더 많이 사용되고 있지만 인스턴스별 안정성은 여전히 ​​잘 알려져 있지 않습니다. 우리는 SummEval에 적용된 두 가지 진단 툴킷을 제시합니다. $\textbf{(1)}$ 낮은 총 위반률($\barρ = 0.8$-$4.1\%$)로 가려진 입력별 광범위한 불일치를 드러내는 전이성 분석으로, $33$-$67\%$의 문서가 l에 표시됩니다.

벤치마크
arXiv (cs.AI)
arXiv 2026-04-16

LLM과 VLM은 비전 없이 시점 회전을 어떻게 이해합니까? 해석 가능성 연구

지난 한 해 동안 공간 지능에 대한 관심이 높아졌습니다. 많은 이전 연구에서는 모델이 시각적 입력을 통해 시공간 정보에 액세스할 수 있는 시각 공간 지능의 관점에서 이를 연구했습니다. 그러나 시각적 정보가 없는 경우 언어 지능만으로도 모델에 공간 지능을 부여하기에 충분한지 여부와 모델이 관련 작업을 수행하는 방법은 무엇입니까?

비전연구
arXiv (cs.AI)
arXiv 2026-04-16

AD4AD: 보다 안전한 자율 주행을 위한 시각적 이상 탐지 모델 벤치마킹

자율주행을 위한 머신비전 시스템의 신뢰성은 훈련 데이터 분포에 크게 좌우됩니다. 차량이 비정형 장애물과 같이 크게 다른 조건에 직면하면 차량의 인지 능력이 크게 저하될 수 있습니다. 오류가 제한적인 결과를 가져오는 많은 영역과 달리 자율 주행의 실패는 통과에 대한 물리적 위험으로 직접적으로 해석됩니다.

비전벤치마크
arXiv (cs.AI)
arXiv 2026-04-16

비전 언어 모델이 인간 감정을 인식하는 데 어려움을 겪는 이유는 무엇입니까?

감정을 이해하는 것은 지능 시스템이 인간과 상호 작용할 수 있는 기본 능력입니다. VLM(시각 언어 모델)은 지난 몇 년 동안 많은 시각적 작업에서 엄청난 발전을 이루었으며 잠재적으로 감정을 이해하기 위한 유망한 솔루션을 제공합니다. 그러나 가장 정교한 현대 VLM조차도 인간의 감정이나 감정을 인식하는 데 어려움을 겪고 있다는 것은 놀라운 일입니다.

비전연구
arXiv (cs.AI)

🎥 영상 & 튜토리얼

기타 2026-04-17

Claude Opus 4.7 - 퍼포먼스와 드라마의 새로운 개척

Claude Opus 4.7이 출시되었지만 모든 헤드라인 뒤에는 더 깊은 이야기가 숨겨져 있습니다. 벤치마크의 노다지에서부터 미국 역사상 가장 큰 메가 프로젝트 중 하나의 결실 보기, 은밀한 Mythos 면책 조항, Anthropic의 컴퓨팅 제한 인정 및 Opus 4.7의 낮은 성능 강제에 이르기까지. 새로운 모델이 Gemini보다 뒤처졌지만 GPT 5.4보다 앞서는 이유와 일부 사용자가 Anthropic에 분노하는 이유

ClaudeAnthropicOpenAIGoogle벤치마크
AI Explained
기타 2026-04-16

DeepMind의 새로운 AI가 인터넷을 깨뜨렸습니다.

❤️ 여기에서 Lambda를 확인하고 GPU 클라우드에 가입하세요: https://lambda.ai/papers 링크: https://deepmind.google/models/gemma/gemma-4/ https://ai.google.dev/gemma/docs/core/model_card_4 Matt Mireles와 함께하는 미세 조정: https://x.com/mattmireles/status/2041606508220489786 기타 출처: https://x.com/googlegemma/status/20412560428821056

Google연구
Two Minute Papers
기타 2026-04-16

수백만 개의 WordPress 사이트가 방금 해킹당했습니다... 또다시

Warp는 터미널에서 탄생한 에이전트 개발 환경입니다. 지금 → https://go.warp.dev/fireship에서 Warp를 무료로 다운로드하세요. 누군가가 엄청난 양의 WordPress 플러그인 컬렉션을 구입하는 데 10만 달러를 지출하고 모든 플러그인에 백도어를 설치했습니다. 당연히 CloudFlare는 플러그인 보안을 영원히 수정하겠다고 약속하는 엉뚱한 WP 대안인 EmDash를 사용했습니다. #코딩 #프로그래밍 #워드프레스 🔖 Top

에이전트코딩
Fireship
기타 2026-04-14

Anthropic의 새로운 AI는 부정행위를 통해 문제를 해결합니다.

❤️ 여기에서 Lambda를 확인하고 GPU 클라우드에 가입하세요: https://lambda.ai/papers 📝 논문은 여기에서 볼 수 있습니다: https://www.anthropic.com/claude-mythos-preview-system-card 링크 및 출처: https://debugml.github.io/cheating-agents/ https://x.com/bstnxbt/status/2042967285715865685 Patreon을 지원하고 싶다면 https://www.patreon.com/TwoMinutePape

ClaudeAnthropic에이전트연구
Two Minute Papers
기타 2026-04-11

NVIDIA의 새로운 AI는 작동하면 안 되지만 작동합니다

❤️ 여기에서 Weights & Biases를 확인하고 무료 데모에 등록하세요: https://wandb.me/papers 📝 보고서는 여기에서 볼 수 있습니다: https://dreamdojo-world.github.io/ Patreon을 지원하고 싶다면: https://www.patreon.com/TwoMinutePapers 🙏 2분 보고서를 가능하게 해주신 관대하신 Patreon 지지자: Adam Bridges, Benji Rabhan, B에게 감사드립니다. 샹, 카메론 네이버, 찰스 이안 노먼 Ve

연구
Two Minute Papers