Insights
AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.
© 2026 Molayo
AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.
본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.
본 논문은 기존 DNN용 테스트 케이스 선택(TCS) 기술이 LLM for Code 모델에도 유효한지 검증하는 대규모 재현 연구를 다룹니다. 클론 탐지, 취약점 탐지 등 다양한 코드 작업에서 TCS 전략의 효과를 분석하여 모델별, 작업별 성능 차이를 입증했습니다.
LLM의 'lost-in-the-middle' 문제를 해결하기 위해 각 계층에 최적의 스케일링 인자를 할당하는 LPES 방법을 제안합니다. 유전 알고리즘과 베지에 곡선을 활용하여 추가적인 미세 조정이나 지연 시간 없이 위치 어텐션 편향을 효과적으로 완화합니다.
암호화된 필사본 이미지를 전사 과정 없이 평문으로 직접 매핑하는 엔드투엔드(end-to-end) 복호화 방식을 제안합니다. 기존의 전사 후 복호화 방식이 가진 전사 오류 전파 문제를 해결하고자 하며, 코피알레 암호를 사례로 성능을 검증했습니다.
Vue.js 애플리케이션의 GUI 테스트를 자동화하기 위해 LLM을 활용하여 페이지 전환 그래프(PTG)를 생성하는 LLMVue 프레임워크를 제안합니다. GPT-4o를 백본으로 사용하여 소스 코드로부터 컴포넌트 계층과 경로를 추론하며, 기존 무작위 탐색 방식보다 높은 테스트 커버리지와 효율성을 입증했습니다.
LLM을 사회적 따뜻함에 맞춰 미세 조정할 때 발생하는 탈옥 취약성과 유해 출력 문제를 조사합니다. 낮은 친화성 페르소나를 조건화하는 데이터 재작성 파이프라인을 통해, 모델의 따뜻함을 유지하면서도 안전성을 강화하는 방법을 제안합니다.
다양한 언어와 감정 조건에서 음성 강조를 탐지할 수 있는 MMEE 코퍼스를 소개합니다. 연구 결과, 다국어 학습이 모델의 견고성을 향상시키며 감정 간 전이 성능이 우수함을 확인했습니다.
BashCoder-R1은 Bash 스크립트 생성의 블랙박스 추론과 강건성 문제를 해결하기 위한 새로운 프레임워크입니다. CPT, L-CoT SFT, 그리고 R-GRPO 강화 학습 기법을 결합하여 설명 가능하고 안전한 코드 생성을 목표로 합니다.
LLM의 수치 예측 정확도를 높이기 위해 Smooth Maximum Mean Discrepancy(SMMD)라는 새로운 손실 함수를 제안합니다. 기존 교차 엔트로피가 숫자의 메트릭 구조를 무시하는 문제를 해결하기 위해 값-거리 커널과 그래프 기반 매끄러움을 결합했습니다.
기업용 지식 그래프를 위한 데이터 중심 Text-to-Cypher 파이프라인인 KG2Cypher를 제안합니다. 그래프 사실로부터 쿼리와 자연어 질문 쌍을 생성하고, SFT를 통해 학습된 생성기가 높은 정확도와 실행률을 달성함을 입증했습니다.
RTL 기술을 기반으로 하드웨어 회로도를 생성하는 멀티모달 LLM의 성능을 평가하기 위한 벤치마크 MultModLM을 제안합니다. 실험 결과, 모델들이 시각적 회로도는 생성할 수 있으나 기능적 정확성은 낮으며, LLM 기반 평가 방식의 신뢰성 문제도 확인되었습니다.
UNICS는 의사코드와 대조 학습 전이를 활용한 새로운 다국어 코드 검색 프레임워크입니다. 데이터 불균형과 의미 손실 문제를 해결하기 위해 2단계 학습 전략을 사용하여 저자원 언어에서도 뛰어난 성능을 보입니다.
LLM 압축 시 할당 비용을 가중치 공간이 아닌 출력 공간 목적 함수와 일치시키는 ROCKET-ActCost 방법론을 제안합니다. 실험 결과, Qwen3-8B 모델에서 정확도는 향상되었으나 퍼플렉서티는 증가하는 트레이드오프가 관찰되었습니다.
RAG 시스템에서 검색된 문맥과 모델의 기존 지식이 충돌하는 문제를 해결하기 위한 새로운 프레임워크 SHIFT를 제안합니다. 뉴런을 직접 수정하는 대신 경량 게이트 모듈을 통해 내부 활성화를 적응적으로 조절하여 모델의 일반 능력을 유지하며 지식 충돌을 완화합니다.
긴 문맥 추론 효율성을 높이기 위해 어떤 레이어에 전체 주의력(Full-attention)을 유지할지 결정하는 NLL 가이드 레이어 선택 방법을 제안합니다. 훈련 없이 NLL 저하를 측정하여 레이어 중요도를 판단하며, Qwen3-4B 실험에서 적은 계산 자원으로도 높은 정확도를 달성했습니다.
본 논문은 양자 시스템과 상호 작용하는 계산 효과를 모델링하기 위한 '양자 도구 모나드'를 소개합니다. 이는 상태 모나드의 비가환 일반화로, 집합 범주와 가측 공간 범주에서의 두 가지 버전을 제안합니다.
긴 문맥 언어 모델의 위치 편향 문제를 해결하기 위해 제안된 '디바이어싱 단일 패스 어텐션 정렬' 방식의 한계를 연구했습니다. 실험 결과, 위치 편향 교정만으로는 반복적인 어텐션 정렬 방식의 성능을 완전히 대체하기 어렵다는 것을 확인했습니다.
역사적 텍스트의 개체명 인식(NER) 성능을 높이기 위해 시간적 메타데이터를 모델에 임베딩하는 다양한 융합 전략을 연구했습니다. 실험 결과, 후기 융합(late fusion) 방식이 초기 및 노이즈가 많은 시기의 데이터에서도 가장 견고한 성능을 보였습니다.
유연 소자(Flexible Electronics) 환경에서 저전력 함수 근사를 위해 개발된 아날로그 Kolmogorov-Arnold Networks(AKANs)를 소개합니다. 하드웨어-소프트웨어 공동 최적화와 가지치기 기법을 통해 회로 결함 속에서도 정확한 연산을 수행하며 전력과 면적을 획기적으로 절감합니다.
멀티 프리시전 공간 아키텍처에서 혼합 정밀도 DNN을 최적화하기 위한 새로운 방법론 SEADA를 제안합니다. SEADA는 시스템 수준의 비용 모델과 비트 수준 엔트로피 기반의 정밀도 선택을 통해 효율적인 매핑을 지원합니다.
Snapdragon 8 Elite SoC 환경에서 모바일 VLM 추론의 단계별 하드웨어 특성을 분석한 연구입니다. NPU 활용 시 프리필과 디코드 단계의 성능 차이, 열 안정성 및 에너지 효율성을 검증하고 최적화된 포팅 방법을 제시합니다.