Insights
AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.
© 2026 Molayo
AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.
본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.
텍스트 속성 그래프(TAG)에서 노드와 이웃 간의 의미론적 불일치를 탐지하는 N2NSC 프레임워크를 제안합니다. LLM과 그래프 위상 정보를 결합하여 텍스트 의미론과 구조적 관계 사이의 대응 관계를 효과적으로 포착합니다.
텍스트 형태의 기술 지침을 LoRA 어댑터로 변환하여 모델의 매개변수에 직접 인코딩하는 ParametricSkills 프레임워크를 제안합니다. 이를 통해 긴 문맥에서도 기술을 효율적으로 활용하며, 인컨텍스트 학습보다 높은 성능과 지속 학습의 가능성을 보여줍니다.
LLM이 대중의 문화적 취향을 모사할 때 발생하는 편향과 한계를 분석한 연구입니다. OpenAI, Anthropic, DeepSeek 모델을 활용해 생성된 '실리콘 대리인'이 인간의 실제 취향 구조를 정형화된 방식으로 왜곡함을 증명했습니다.
본 연구는 RAG 시스템 내 생성 단계에서 소형 언어 모델(SLM)의 성능과 효용성을 조사합니다. 다양한 데이터셋을 통한 벤치마킹 결과, SLM 기반 RAG 시스템이 GPU 없이 온디바이스 환경에서도 효율적으로 실행될 수 있음을 입증했습니다.
TIGRAG는 토큰 공생 지식 그래프를 활용하여 멀티홉 추론 성능을 개선한 효율적인 RAG 프레임워크입니다. 기존 그래프 RAG의 높은 계산 비용과 LLM 의존성을 해결하며, 인덱싱 및 추론 지연 시간을 대폭 단축했습니다.
대화 중 의미론적 콘텐츠의 흐름을 정량화하는 정보 이론적 프레임워크를 제안합니다. LLM을 활용해 의미론적 전이 엔트로피(STE)와 부분 정보 분해(SPID)를 계산하여 정보의 방향성과 기여도를 분석합니다.
Chain-of-Thought(CoT) 프롬프팅의 효과가 단순히 토큰 길이에 의한 연산량 증가 때문인지, 아니면 의미론적 내용 때문인지 분석한 연구입니다. 실험 결과, CoT의 성능 향상은 단순한 장황함이 아니라 추론 및 검증 과정에 담긴 질적인 내용에 달려 있음을 입증했습니다.
본 연구는 DNA 언어 모델의 사전 학습(Pre-training)이 미세 조정(Fine-tuning) 성능에 미치는 영향을 체계적으로 평가합니다. 트랜스포머 기반 모델의 효율성과 BPE 토큰화 방식의 적절성을 중심으로 벤치마크 분석을 수행합니다.
텍스트-비디오 생성 모델의 품질을 높이기 위해 데이터 매니폴드를 보상 모델로 활용하는 Shell-LCC 기법을 제안합니다. LCC의 평균 회귀 문제를 해결하기 위해 등방성 쉘 모델링을 도입하여 비디오의 사실성과 세부 디테일을 개선합니다.
문맥적 언어 모델이 문법적 성별과 사회적 편향을 혼동하는 문제를 해결하기 위해, 문맥적 임베딩에서 문법적 성별을 분리하는 연구를 수행했습니다. 통제된 템플릿과 자연스러운 문맥을 활용하여 성별 방향을 추정하는 프레임워크를 제안했습니다.
Cortex는 웹 규모의 코퍼스를 체계적으로 조직화하기 위해 온톨로지 코퍼스 그래프(OCG)를 활용하는 새로운 프레임워크를 제안합니다. 3층 구조의 이종 구조를 통해 고품질 데이터 정제와 도메인 간 연관성을 확보하며, 이를 검증하기 위한 CortexBench를 함께 선보입니다.
DAIN은 멀티모달 융합을 동적인 다중 에이전트 협력 프로세스로 재개념화한 새로운 프레임워크입니다. 메타 컨트롤러를 통해 에이전트의 희소 활성화와 통신을 조율하여 정확도와 효율성을 동시에 최적화합니다.
방사선 보고서 생성(RRG) 모델이 시각적 증거 대신 사전 지식이나 가짜 상관관계에 의존하는 '시각적 지름길' 문제를 평가하기 위한 새로운 벤치마크 SHOVIR을 제안합니다. 8개의 최첨단 VLM을 분석한 결과, 보고서 품질이 높더라도 시각적 근거 제시 능력은 낮을 수 있음을 확인했습니다.
멀티모달 모델의 추론 효율성을 높이기 위해 초안 모델과 타겟 모델 사이에서 쿼리를 적응적으로 전달하는 선제적 라우팅(PRP) 패러다임을 제안합니다. 기존 방식과 달리 모델의 역량을 공동 평가하여 조기에 의사 결정을 내림으로써 성능 저하 없이 추론 속도를 가속화합니다.
임상 시험 내 투여 오류를 탐지하기 위해 BioBERT 등 도메인 특화 Transformer 모델을 활용한 연구입니다. 텍스트 임베딩과 범주형 특징을 결합하여 오류 예측 성능을 평가하였으며, 도메인 정렬의 중요성을 입증했습니다.
마비성 구어(Dysarthria) 인식을 위해 인간 청취자와 최신 ASR 시스템의 성능을 비교한 연구입니다. 미세 조정을 거친 개인화된 DSR 모델이 인간보다 우수한 성능을 보였으며, 향후 특정 음소 및 자발적 발화 개선의 필요성을 제시합니다.
불완전한 지식 그래프 증거를 바탕으로 LLM의 추론 궤적을 그라운딩하는 이론적 프레임워크를 제안합니다. 하드 그라운딩의 한계를 지적하며, LLM의 사전 확률을 활용한 소프트 그라운딩(soft grounding) 방식의 유효성을 입증합니다.
허위 정보 탐지를 위해 인간의 의사 결정 과정을 모방한 멀티 에이전트 시스템을 제안하는 연구입니다. 오픈 소스 LLM을 활용하여 합의 메커니즘과 계층적 구조를 통합함으로써 기존 GPT 모델 대비 우수한 성능을 입증했습니다.
개인정보(PII) 탐지 및 비식별화를 지원하기 위해 LLM으로 생성된 다국어 합성 대화 데이터셋 DialogPII를 제안합니다. 11개 언어와 8가지 시나리오를 포함하며, 텍스트와 음성 전사본이 정렬된 고품질 자원을 제공합니다.
언어 에이전트의 경험을 모델 파라미터에 선택적으로 통합하는 EVAF 메커니즘과 이를 검증하기 위한 검사-재검사 프로토콜을 제안합니다. 실험 결과, EVAF는 사실적 기억을 보존하면서도 가치 있고 놀라운 경험을 우선적으로 내재화하여 행동 지속성을 높였습니다.