Insights
AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.
저예산으로 AI 모델 실행하기: Ollama와 무료 LLM 사용 경험
GPU가 없는 저사양 클라우드 환경에서 Ollama와 무료 API를 활용해 비용 없이 AI 모델을 실행하는 최적화 방법을 소개합니다. 메모리 관리와 모델 선택 전략을 통해 제한된 자원에서도 효율적인 AI 시스템을 구축할 수 있습니다.
속보: OpenAI의 새로운 GPT-5.5-Cyber, CyberGym에서 Mythos 5를 능가하는 점수 기록
OpenAI의 새로운 모델인 GPT-5.5-Cyber가 소프트웨어 취약점 재현 능력을 평가하는 CyberGym 벤치마크에서 Mythos 5를 능가하는 성적을 거두었습니다.
TSMC도 가격 인상 대열에 합류, 7나노까지 올려 고객사들 당황
TSMC가 7나노 공정을 포함한 대부분의 공정 노드에서 가격 인상을 단행하며 고객사들에게 충격을 주고 있습니다. 이번 인상은 메모리 업체들의 가격 인상에 따른 후속 조치로, TSMC의 매출총이익률 상승과 시장 지배력 강화로 이어질 전망입니다.
외계 생명체를 찾기 위한 AI의 탐색이 이제 막 시작되었습니다.
Oxford와 Cambridge 연구진이 외계 행성의 대기 데이터를 분석하여 생명체 존재 가능성을 탐색하기 위한 새로운 벤치마크 데이터셋인 ThousandWorlds를 공개했습니다. 이 데이터셋은 다양한 기후 모델과 시뮬레이션을 포함하여 외계 행성의 대기 변수를 에뮬레이션합니다.
Diffusion Unlearning에서의 공존하는 연관 유지 개념 (Co-occurring associated retained
확산 모델의 언러닝 과정에서 유해 개념과 함께 삭제되는 무해한 공존 개념(CARE) 문제를 해결하기 위한 연구입니다. CARE 점수와 이를 보호하는 ReCARE 프레임워크를 제안하여 대상 개념만 정밀하게 삭제하면서 모델의 유용성을 유지합니다.
AI 에이전트의 실시간 시장 거래 가능성 확인을 위한 Arena 대회 결과 및 개선 사항
AI 에이전트의 실시간 시장 거래 가능성을 검증하기 위한 Arena 대회의 운영 결과와 개선 사항을 다룹니다. 단기 수익 중심의 주간 주기 문제와 자본 할당 제한 문제를 해결하기 위한 시스템 재설계를 예고합니다.
ViralBench 소개: 모델의 바이럴(Viral) 능력을 테스트하는 최초의 AI 벤치마크
AI 모델의 소셜 미디어 바이럴 능력을 측정하는 최초의 벤치마크인 ViralBench를 소개합니다. GPT, Opus, Kimi 등의 모델이 인간의 개입 없이 TikTok 콘텐츠를 생성하고 조회수를 확보하는 과정을 실험합니다.
현재 시장 상황에 대한 전체적인 분석: 일반적인 FinX 요약과는 다름
최근 기술주 중심의 변동성과 함께 시장의 흐름이 Mag 7에서 인프라, 에너지, 신흥 시장으로 확산되고 있습니다. 연준의 매파적 태도와 AI 설비투자 수익성에 대한 의구심이 기술주 하락을 견인했습니다.
대화에서 발견으로: 대화형 상품 검색 어시스턴트를 위한 속성 인지 선호도 도출
대화형 상품 검색 어시스턴트의 효율성을 높이기 위한 속성 지향적 선호도 도출 프레임워크인 D2D를 제안합니다. 제품 속성 구조를 활용해 정보량이 많은 쿼리에 우선순위를 부여함으로써, 정확한 추천과 대화 시간 단축을 동시에 달성합니다.

추정된 Nvidia AI GPU 수량
주요 빅테크 기업들의 Nvidia AI GPU 추정 수량과 함께, Nvidia 독점 내러티브에 반하는 다양한 시장 현실을 분석합니다. 기업들이 컴퓨팅 자원을 광고 수익화 및 다양한 비즈니스 모델에 활용하고 있음을 강조합니다.
MMed-Bench-IR: 다국어 의료 정보 검색을 위한 이질적 벤치마크
다국어 의료 정보 검색 능력을 평가하기 위한 새로운 벤치마크인 MMed-Bench-IR을 소개합니다. 교차 언어 정렬, 개념 판별, 증거 검색의 세 가지 핵심 능력을 6개 언어로 측정하며, 기존 모델들의 심각한 다국어 성능 격차를 입증했습니다.
방어로서의 결맞음 해제와 노이즈 정규화의 크기: 적대적 공격에 강건한 네트워크 침입 탐지를 위한 확률적 양자 신경망의 엄밀한 N-큐비트 이론
확률적 양자 신경망(SQNN)을 활용하여 적대적 공격에 강건한 네트워크 침입 탐지 이론을 제시합니다. 탈분극 채널과 게이트별 드롭아웃의 정규화 효과를 수학적으로 증명하고, 실제 데이터셋에서 기존 모델보다 뛰어난 방어 성능을 입증했습니다.
SURGELLM: 클래스 균형 정규화(Class-Balanced Normalization)와 태스크 인지적 특징 게이팅(Task-Aware
SURGELLM은 NLP 태스크 간의 귀납적 편향 불일치와 클래스 불균형 문제를 해결하기 위한 통합 트랜스포머 프레임워크입니다. 수술적 특징 게이트와 인스턴스 가중 정규화(IWN)를 통해 다양한 태스크에서 성능을 크게 향상시켰습니다.
Pigeonholing: 잘못된 프롬프트가 모델의 붕괴와 오류를 유발하는 현상
잘못된 컨텍스트가 LLM의 성능 저하와 모드 붕괴를 유발하는 'Pigeonholing' 현상을 분석한 연구입니다. 잘못된 답변의 반복이나 좁은 답변 세트로의 수렴 문제를 다루며, RLVR을 통한 완화 방안을 제시합니다.
CALIBER: 언어 모델의 추론 전후 신뢰도 교정 (Calibrating Confidence Before and After Reasoning
추론 언어 모델의 신뢰도를 사고 전과 후로 구분하여 교정하는 CALIBER 프레임워크를 제안합니다. 사고 전에는 프롬프트 해결 확률을, 사고 후에는 답변의 정답 가능성을 예측하도록 설계하여 교정 오차를 획기적으로 줄였습니다.
AVOC: 검색 기반 토큰 압축을 통한 Omni-Modal LLM의 시간 단위 오디오-비디오 이해 능력 향상
AVOC는 긴 형식의 오디오-비디오 이해를 위해 검색 기반 토큰 압축 기술을 도입한 프레임워크입니다. 관련성, 중요도, 다양성 기준을 활용해 컨텍스트 예산 내 최적의 토큰을 검색함으로써 멀티모달 LLM의 성능을 극대화합니다.
Prague Dependency Treebank -- Consolidated 2.0: 복잡한 주석 체계의 강화
30년간의 연구를 통해 완성된 체코어 언어 리소스인 Prague Dependency Treebank Consolidated 2.0(PDT-C 2.0)을 공개합니다. 약 400만 토큰 규모의 이 코퍼스는 상호 참조와 담화 관계를 포함한 복잡한 언어 계층을 체계적으로 주석화하여 NLP 연구에 기여합니다.
33가지 CLI 변경 사항이 포함된 Claude Code 2.1.186 출시
Claude Code 2.1.186 버전이 33가지 CLI 변경 사항과 함께 출시되었습니다. MCP 서버 직접 인증 및 쉘 명령 실행 시 어시스턴트 자동 트리거 기능이 추가되었습니다.
도메인 수직 계열화에 따른 Transformer 기반 언어 모델: 아키텍처, 응용 및 비판적 평가
Transformer 기반 언어 모델의 아키텍처 분류와 2023년 이후의 주요 기술적 발전을 리뷰합니다. 다양한 모델 변형과 학습 방법론을 정리하고, 도메인별 활용 사례 및 파라미터와 에너지 비용 간의 트레이드오프를 비판적으로 평가합니다.
UD_Czech-PDTC 소개: Universal Dependencies의 대규모 및 장르 풍부 트리뱅크 (Treebank)
Czech어의 대규모 트리뱅크인 Prague Dependency Treebank-Consolidated(PDT-C)를 Universal Dependencies(UD) 형식으로 변환하는 과정을 다룬 논문입니다. 기존 PDT 대비 규모와 장르 다양성이 확대되었으며, 두 주석 체계 간의 구조적 차이를 극복하는 방법론을 제시합니다.
이 피드 구독하기
본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.