본문으로 건너뛰기

Home About Portfolio Blog Insights Resume Contact

Home About Portfolio Blog Insights Resume Contact

© 2026 Molayo

Insights

AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.

© 2026. Molayo. All rights reserved.

개인정보 처리방침|이용약관

Home About Portfolio Blog Insights Resume Contact

Home About Portfolio Blog Insights Resume Contact

© 2026 Molayo

Insights

AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.

전체 AI Research AI Engineering Claude Code Codex Game Dev Hardware & Silicon Finance & Markets AI Design

이 피드의 글은 AI가 공개된 소스를 자동으로 수집·요약·번역한 것이에요. 저작권 안내를 확인해주세요.

본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.

이 피드 구독하기

RSSFeedly, Inoreader 등으로 구독

API/api/search?q=검색어

AIllms.txt로 AI 크롤링 가이드

© 2026. Molayo. All rights reserved.

개인정보 처리방침|이용약관

필터arXiv cs.CL836건

arXivAI 번역논문

iPOE: 설명을 통한 해석 가능한 프롬프트 최적화 (Interpretable Prompt Optimization via

iPOE는 LLM의 프롬프트 최적화 과정에서 투명성과 해석 가능성을 높이기 위해 제안된 새로운 전략입니다. 어노테이션 결정에 대한 설명을 바탕으로 자동 생성된 가이드라인을 최적화하여, 성능 향상과 동시에 프롬프트가 왜 그렇게 구성되었는지에 대한 논리적 근거를 제공합니다.

arXivAI 번역논문

FOL2NS: 1차 논리(First-Order Logic)로부터 자연스러운 문장 생성하기

FOL2NS는 1차 논리(First-Order Logic) 공식을 자연스러운 문장으로 변환하기 위해 설계된 신경 기호적(neurosymbolic) 프레임워크입니다. 규칙 기반 모듈과 미세 조정된 언어 모델을 결합하여 복잡한 양화사 구조를 가진 논리식을 처리하며, 문장의 다양성과 커버리지를 높이는 데 집중합니다.

arXivAI 번역논문

확장 가능한 환경이 일반화 가능한 에이전트를 견인한다

일반화 가능한 에이전트 개발을 위해서는 단순한 데이터 확장을 넘어, 실행 가능한 규칙 세트의 분포를 넓히는 '환경 확장(environment scaling)'이 필수적입니다. 본 논문은 궤적, 작업, 환경 확장을 구분하는 새로운 분류 체계를 제안하며, 프로그래밍 방식의 생성기와 생성적 세계 모델을 활용한 환경 구축 패러다임을 제시합니다.

arXivAI 번역논문

SIREM: 학습된 샘플링을 이용한 음성 정보 기반 MRI 재구성

SIREM은 실시간 MRI(rtMRI)의 해상도와 획득 속도 간의 상충 관계를 해결하기 위해 동기화된 음성 정보를 교차 모달 사전 정보로 활용하는 새로운 재구성 프레임워크입니다. 음성 데이터로부터 성도 구조를 예측하는 오디오 브랜치와 k-공간 데이터를 활용하는 MRI 브랜치를 결합하여, 해부학적으로 정확하면서도 빠른 재구성을 가능하게 합니다.

arXivAI 번역논문

지식 그래프 링크 예측을 위한 Seq2Seq 모델 내 그래프 구조 활용

지식 그래프의 링크 예측 성능을 높이기 위해 T5-small 모델과 관계형 그래프 어텐션 네트워크(RGAT)를 결합한 GA-S2S 프레임워크를 제안합니다. 이 모델은 기존 Seq2Seq 모델이 놓치기 쉬운 그래프의 구조적 토폴로지와 텍스트 특징을 동시에 인코딩하여 멀티홉 관계 패턴을 효과적으로 포착합니다. CoDEx 데이터셋 실험 결과, 기존 베이스라인 대비 링크 예측 정확도에서 최대 19%의 성능 향상을 기록했습니다.

arXivAI 번역논문

효율적인 긴 문맥 생성을 위한 문맥 암기 (Context Memorization)

긴 조건부 접두사를 사용하는 LLM 추론 시 발생하는 어텐션 계산량 증가와 영향력 약화 문제를 해결하기 위해 '어텐션 상태 메모리(Attention-state memory)' 방식을 제안합니다. 이 방식은 사전 계산된 어텐션 상태를 경량화된 조회 기반 메모리로 외재화하여, 추가 학습 없이도 정확도를 높이고 지연 시간을 단축합니다. 실험 결과 LLaMA-3.1-8B 모델에서 인컨텍스트 학습보다 높은 정확도와 향상된 추론 효율성을 입증했습니다.

arXivAI 번역논문

저자원 언어를 이용한 LLM의 다국어 탈옥 (Multilingual jailbreaking)

본 연구는 저자원 아프리카 언어를 활용한 다회차 대화가 상용 LLM의 안전 가드레일을 우회할 수 있는지 조사했습니다. 실험 결과, 단회차 번역 공격은 효과가 낮았으나 다회차 대화 방식은 모델에 따라 최대 83.6%의 높은 유해 응답률을 기록하며 탈옥에 성공했습니다. 특히 번역 품질이 높을수록 탈옥 성공률이 증가하며, 인간 레드팀이 자동화된 방식보다 더 높은 탈옥률을 보였습니다.

arXivAI 번역논문

SomaliWeb v1: 일치하는 Tokenizer 및 공개 언어 식별(Language-Identification) 벤치마크를 포함한 품질

SomaliWeb v1은 소말리어 전용 토크나이저와 언어 식별 벤치마크를 포함한 최초의 고품질 사전 학습 코퍼스입니다. 기존 다국어 데이터셋의 중복 문제와 글자 깨짐(Mojibake) 결함을 분석하고, GPT-4보다 효율적인 BPE-16K 토크나이저를 제안합니다.

arXivAI 번역논문

마스크 확산 언어 모델 (Masked Diffusion Language Models)을 위한 머신 언러닝 (Machine Unlearning)

본 논문은 LLaDA 및 Dream과 같은 마스크 확산 언어 모델(MDLMs)을 위한 최초의 머신 언러닝 프레임워크인 MDU(Masked Diffusion Unlearning)를 제안합니다. MDU는 확산 관점에서 지식 학습 과정을 재검토하여, 온도 스케일링을 통해 프라이버시와 유용성 사이의 균형을 조절하며 특정 지식을 효과적으로 제거합니다. 실험 결과, MDU는 기존 LLM 언러닝 방식보다 뛰어난 성능을 입증했습니다.

arXivAI 번역논문

CodeBind: 통합 구성 코드북을 통한 멀티모달 정렬을 위한 분리된 표현 학습

CodeBind는 멀티모달 표현 정렬 시 발생하는 데이터 부족과 모달리티 간 불일치 문제를 해결하기 위해 제안된 새로운 프레임워크입니다. 공유 구성 요소와 모달리티 특화 구성 요소로 분리된 코드북 설계를 통해, 완전한 쌍을 이룬 데이터 없이도 다양한 모달리티를 효과적으로 정렬합니다. 9가지 다양한 모달리티에 대해 검증되었으며, 멀티모달 분류 및 검색 작업에서 최첨단 성능을 보여줍니다.

arXivAI 번역논문

SD-Search: 검색 증강 추론을 위한 온폴리시(On-Policy) 사후 시각 자기 증류(Hindsight Self-Distillation)

SD-Search는 외부 교사 모델이나 추가적인 주석 없이도 검색 증강 추론(Search-augmented reasoning) 에이전트의 성능을 높이는 온폴리시 사후 시각 자기 증류 기법을 제안합니다. 단일 모델이 롤아웃의 결과를 요약하는 교사 역할과 컨텍스트만 보는 학생 역할을 동시에 수행하며, 이를 통해 거친 궤적 보상을 조밀한 단계별 신호로 변환하여 학습 효율을 극대화합니다.

arXivAI 번역논문

지식에서 검증으로: 지식 집약적 도메인에서의 LLM을 위한 RLVR 탐색

본 연구는 수학이나 코딩을 넘어 지식 집약적 도메인에서 LLM의 추론 능력을 향상시키기 위한 RLVR(검증 가능한 보상을 활용한 강화학습) 프레임워크인 K2V를 제안합니다. K2V는 자동화된 데이터 합성 기술을 통해 고품질 데이터를 확보하고, 최종 정답뿐만 아니라 추론 과정 자체를 검증함으로써 기존 RLVR의 한계를 극복합니다.

arXivAI 번역논문

양에서 가치로: 온디바이스 RAG를 위한 선호도 정렬 메모리 구축

온디바이스 AI 에이전트의 개인정보 보호와 응답성을 위해, 제한된 메모리 환경에서도 사용자 선호도를 효과적으로 반영할 수 있는 EPIC(Efficient Preference-aligned Index Construction) 기술을 제안합니다. EPIC은 원시 데이터에서 선호도 관련 정보만을 선택적으로 추출하여 인덱싱함으로써, 메모리 사용량을 획기적으로 줄이면서도 검색 정확도와 속도를 대폭 향상시킵니다.

arXivAI 번역논문

Infini-News: 13억 개의 처리된 Common Crawl 뉴스 기사에 대한 효율적인 쿼리 가능 접근 방식

Infini-News는 13억 개 이상의 Common Crawl 뉴스 기사를 효율적으로 검색하고 분석할 수 있도록 설계된 새로운 툴킷이자 인덱스입니다. 텍스트 정제, 언어 감지, 지리적 귀속 정보를 포함한 풍부한 메타데이터를 제공하며, Suffix-array 기반의 Infini-gram 인덱스를 통해 대규모 아카이브 내 텍스트 패턴을 1초 미만으로 검색할 수 있습니다.

arXivAI 번역논문

SkillsVote: 수집, 추천에서 진화에 이르는 에이전트 기술의 생애주기 거버넌스

SkillsVote는 LLM 에이전트의 경험 궤적을 체계적인 '에이전트 기술(Agent Skills)'로 관리하기 위한 생애주기 거버넌스 프레임워크입니다. 이 시스템은 기술의 수집, 추천, 검증 및 진화 과정을 구조화하여 노이즈가 많은 데이터를 정제하고, 성공적인 기술만을 라이브러리에 업데이트함으로써 에이전트의 성능을 지속적으로 향상시킵니다. 실험 결과, 모델 업데이트 없이도 외부 기술 라이브러리 관리를 통해 Terminal-Bench 2.0 및 SWE-Bench Pro 성능을 유의미하게 개선했습니다.

arXivAI 번역논문

조건문에서의 전제와 추론: 인간과 LLM에 대한 이론 기반 연구

본 연구는 조건문에서의 전제 투영(Presupposition projection) 능력을 바탕으로 인간과 LLM의 추론 방식을 비교 분석합니다. 실험 결과, 인간은 확률적 및 화용적 단서를 통합하여 판단하는 반면, LLM은 화용적 역량보다는 표면적인 패턴 매칭에 의존하는 경향을 보였습니다.

arXivAI 번역논문

EvoMemBench: 자기 진화적 관점에서의 에이전트 메모리 벤치마킹

LLM 에이전트의 핵심 요소인 메모리 능력을 평가하기 위해 자기 진화적 관점에서 설계된 통합 벤치마크 EvoMemBench를 제안합니다. 이 벤치마크는 메모리 범위와 내용이라는 두 가지 축을 기준으로 에이전트의 정보 저장, 업데이트 및 검색 능력을 체계적으로 분석합니다. 연구 결과, 현재의 메모리 시스템은 작업 유형에 따라 성능 차이가 크며 단일 솔루션으로 모든 상황을 해결하기 어렵다는 점을 시사합니다.

arXivAI 번역논문

잠재적 시각적 추론 (Latent Visual Reasoning)을 가로막는 장애물은 무엇인가?

본 연구는 시각-언어 모델(VLM)이 중간 시각적 단계를 시뮬레이션하는 '잠재적 시각적 추론' 과정에서 겪는 한계를 분석합니다. 실험 결과, 현재 모델들은 잠재 토큰을 인과적으로 활용하지 못하고 있으며, 이는 정보가 부족한 데이터셋과 추론 시 발생하는 잠재 토큰의 표현 붕괴(collapsing) 현상 때문인 것으로 밝혀졌습니다.

arXivAI 번역논문

BERT에서 T5까지: 개체명 인식 (NER)에 관한 연구

본 보고서는 BERT와 T5 모델을 활용하여 개체명 인식(NER) 작업을 수행하고 두 아키텍처의 성능을 비교 분석합니다. BERT는 인코더 전용 구조와 분류 헤드를 사용하고, T5는 시퀀스 투 시퀀스 구조와 퓨샷 프롬프트를 활용하여 미세 조정을 진행했습니다. 다양한 하이퍼파라미터 절제 연구와 성능 지표 분석을 통해 각 모델의 특성과 오류 패턴에 대한 통찰을 제공합니다.

arXivAI 번역논문

Prompt2Fingerprint: 텍스트-가중치 생성을 통한 플러그 앤 플레이 (Plug-and-Play) LLM 핑거프린팅

Prompt2Fingerprint(P2F)는 텍스트 설명을 통해 LLM의 식별 신호를 생성하는 새로운 핑거프린팅 프레임워크입니다. 기존의 미세 조정 방식과 달리 추가적인 재학습 없이 단 한 번의 순전파만으로 저차원 파라미터 증분을 생성하여 모델 출처를 추적할 수 있습니다. 이를 통해 계산 비용을 획기적으로 줄이면서도 높은 정확도와 강건성을 유지하며 모델 소유권을 관리할 수 있습니다.

이전4 / 42전체 42페이지 중 4페이지다음