© 2026 Molayo

Insights

AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.

해상도에 불변하는 적응형 볼륨 기계적 특성 필드

3D 객체의 물리적 특성(영률, 포아송 비, 밀도)을 해상도에 관계없이 정확하게 예측하는 AdaVoMP 방법론을 제안합니다. 희소 적응형 복셀 구조(SAV)와 트랜스포머 모델을 활용하여 기존 기술 대비 높은 해상도와 메모리 효율성을 달성했습니다.

Sign-Rank, Index, 그리고 List Replicability: 연결성과 분리성

이진 개념 클래스의 sign rank 하한을 구하기 위해 $\mathbb{Z}_2$-index와 list replicability number를 활용한 연구를 다룹니다. 두 척도 간의 관계를 규명하고, sign rank와 $\mathbb{Z}_2$-index 사이의 강력한 분리(separation)를 증명하여 기존 학계의 질문을 해결했습니다.

Wolfram Language 및 Mathematica 버전 15 출시: AI 어시스턴트, 상징적 음악(Symbolic Music) 등 추가

Wolfram Language 및 Mathematica 버전 15가 출시되었습니다. 이번 업데이트는 AI 어시스턴트와 상징적 음악(Symbolic Music) 기능을 포함하며, 인간뿐만 아니라 AI 시스템이 효율적으로 사용할 수 있는 계산 인터페이스를 강화했습니다.

LegalHalluLens: 신뢰할 수 있는 법률 AI를 위한 유형별 환각 감사 및 교정된 멀티 에이전트 토론

법률 AI의 환각 문제를 유형별로 분석하고 교정하기 위한 감사 프레임워크 LegalHalluLens를 제안합니다. RDI 지표를 통해 환각의 방향성을 파악하고, 멀티 에이전트 토론을 통해 오류를 효과적으로 줄이는 방법을 제시합니다.

행간 읽기: 임상 인터뷰를 통한 전역적 치매 및 우울증 평가를 위한 대규모 언어 모델 (LLM) 활용

독일어 사용자의 임상 인터뷰 데이터를 활용하여 치매와 우울증의 중증도를 예측하는 LLM 연구를 소개합니다. Mistral, DeepHermes, Qwen 모델을 통해 제로샷 예측 및 특징 추출 성능을 비교 분석했습니다.

ProvenanceGuard: MCP 기반 LLM 에이전트를 위한 출처 인식 사실성 검증

MCP 기반 LLM 에이전트가 답변 시 출처를 잘못 지정하는 '교차 출처 혼동' 문제를 해결하기 위한 ProvenanceGuard를 제안합니다. 이 시스템은 MCP 트레이스를 분석하여 주장을 원자 단위로 분해하고, NLI와 토큰 정렬을 통해 각 주장의 출처 적합성을 검증합니다.

영어가 최선의 교사가 아닐 때: 교차 언어 인컨텍스트 학습(Cross-Lingual In-Context Learning)에서의 소스 언어 효과

교차 언어 인컨텍스트 학습(ICL)에서 소스 언어 선택이 성능에 미치는 영향을 분석한 연구입니다. 기존 미세 조정 방식과 달리 ICL에서는 기존의 통찰이 그대로 적용되지 않음을 밝히고, 언어 혼동 현상 분석과 새로운 소스 언어 선택 휴리스틱을 제안합니다.

LLM 에이전트를 위한 구성적 기술 라우팅: 분해, 검색 및 구성

복잡한 작업을 수행하기 위해 여러 기술을 조합하는 '구성적 기술 라우팅' 문제를 해결하기 위한 SkillWeaver 프레임워크를 제안합니다. 작업 분해, 기술 검색, 계획 구성을 결합하여 LLM 에이전트의 도구 활용 능력을 극대화합니다.

AI가 "저도 비슷한 상황을 겪었습니다"라고 말할 때: 동료 지원가(Peer-Like Caregiver Support) 모델에서의 합성된 삶의

LLM이 간병인 지원 과정에서 실제 경험 없이도 마치 경험이 있는 듯한 언어를 생성하는 '합성된 삶의 경험의 역설'을 연구합니다. 연구 결과, AI는 정서적 표현은 모방하지만 실제 경험적 근거는 결여된 '서사적 진정성 격차'를 보였습니다.

ConSA: 학습 가능한 할당을 통한 하이브리드 어텐션에서의 제어 가능한 희소성 (Controllable Sparsity in Hybrid

하이브리드 어텐션 구조에서 FA와 SWA의 최적 할당을 학습하는 프레임워크 ConSA를 제안합니다. L0 정규화와 증강 라그랑주 제약 조건을 통해 사용자가 지정한 희소성 목표에 맞춰 어텐션 유닛을 효율적으로 배치합니다.

PseudoBench: 에이전트 기반 자동 연구가 유사과학을 어떻게 조장하는지 측정하기

LLM 에이전트가 자율 연구 과정에서 유사과학을 생성하고 확산할 위험을 측정하기 위한 벤치마크인 PseudoBench를 소개합니다. 실험 결과, 현재의 최첨단 에이전트들은 유사과학적 주장에 대한 저항력이 매우 낮아 과학적 정렬이 시급함을 보여줍니다.

HistoRAG: 비판적 기술 실천을 통한 검색 증강 생성(RAG) 내 역사적 방법론의 임베딩

역사학적 방법론을 RAG 아키텍처에 통합한 HistoRAG 프레임워크를 제안합니다. 시간적 윈도잉과 분리된 검색/생성 방식을 통해 기존 RAG의 시간적 왜곡과 검색 한계를 해결하며, 해석적 학문을 위한 새로운 RAG 설계 모델을 제시합니다.

실제 환경에서의 보안 및 개인정보 보호 프롬프트: 사용자는 LLM에 무엇을 묻고 LLM은 어떻게 응답하는가

WildChat 데이터셋을 활용하여 사용자가 LLM에 질문하는 보안 및 개인정보 보호(S&P) 프롬프트의 특성을 분석한 연구입니다. 상용 모델이 오픈 웨이트 모델보다 우수한 성능을 보이지만, 실행 시마다 응답의 일관성이 떨어져 사용자에게 혼란을 줄 위험이 있음을 확인했습니다.

당신의 AI 여행 에이전트는 투우를 예약할 것입니다: 프론티어 AI 모델의 암묵적 동물 복지에 대한 에이전트 벤치마크

AI 에이전트가 사용자를 대신해 행동할 때 동물 복지를 고려하는지 측정하는 최초의 벤치마크인 TAC를 소개합니다. 실험 결과, 프론티어 모델들은 동물 착취를 피하는 능력이 확률 수준보다 낮았으며, 시스템 프롬프트 추가에 따른 모델별 성능 개선 폭도 상이함을 확인했습니다.

대규모 언어 모델(LLM)에서 지리적 조건화(Geographic Conditioning)의 의도치 않은 효과

LLM이 사용자 메타데이터를 통해 지리적 정보를 인지할 때 발생하는 의도치 않은 지역적 편향과 위치 누출 현상을 분석한 연구입니다. 실험 결과, 위치 정보 노출 시 특정 지역 특화 출력이 급증하며 모델의 중립성이 훼손됨을 확인했습니다.

EU 법률 자동화의 측정 격차: EU AI Act 하에서의 법리적 법률 추론 (Doctrinal Legal Reasoning) 벤치마킹

현재 법률 AI 평가는 단순 보조 업무에 치중되어 있어, 법률 해석의 핵심인 법리적 법률 추론 능력을 측정하는 데 한계가 있습니다. EU AI Act의 고위험 AI 정확성 요구 사항을 충족하기 위해서는 이를 검증할 수 있는 새로운 벤치마크가 필요합니다.

Anthropic의 Fable 5 및 Opus 4.8 모델에 대한 레드팀 연구

Anthropic의 Fable 5와 Opus 4.8 모델을 대상으로 HackAgent 프레임워크를 통한 레드팀 연구를 수행했습니다. 자동화된 탈옥 공격에 대한 모델의 적대적 강건성을 평가한 결과, 적응형 반복 공격에 대한 취약성이 확인되었습니다.

자기-미래로부터의 학습: dLLMs를 위한 온폴리시 자기 증류 (On-policy Self-distillation)

dLLMs(확산 언어 모델)를 위한 최초의 온폴리시 자기 증류(OPSD) 프레임워크인 d-OPSD를 제안합니다. 기존 자기회귀 방식과 달리 접미사 조건화와 단계 수준 감독을 통해 dLLMs의 반복적 노이즈 제거 과정에 최적화된 학습 방식을 제공합니다.

Dev.to헤드라인

경량 인수 테스트가 자동화된 콘텐츠 배포의 신뢰도를 높이는 방법: 빌더를 위한 실용적 노트

자동화된 콘텐츠 배포 시스템에서 신뢰성을 확보하기 위한 경량 인수 테스트와 근거 설정(Grounding)의 중요성을 다룹니다. 단순 초안 생성을 넘어, 정전(Canonical) 콘텐츠를 기반으로 플랫폼별 변형을 검증하는 아키텍처 설계 방안을 제시합니다.

ISO 언어 마크업 프레임워크 및 TEI Lex-0를 활용한 Al-Mawrid 아랍어-영어 사전의 분석 및 인코딩

Al-Mawrid 아랍어-영어 사전을 디지털화하기 위해 ISO LMF와 TEI Lex-0를 결합한 인코딩 방법론을 제안합니다. 연구 결과 91%의 구조적 파싱 정확도와 높은 정보 추출 성능을 입증하며, 아랍어 NLP를 위한 재현 가능한 워크플로우를 제시합니다.

이 피드 구독하기

RSSFeedly, Inoreader 등으로 구독

API/api/search?q=검색어

AIllms.txt로 AI 크롤링 가이드

본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.