Insights
AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.
의미론적 코드 클론 탐지: 우리는 도달했는가?
최신 의미론적 코드 클론 탐지기들이 벤치마크 성능은 높지만 실제 환경에서의 일반화 능력은 부족함을 실증적으로 분석한 연구입니다. 연구팀은 새로운 클론 연산자 프레임워크를 통해 탐지기들이 의미론적 이해 대신 어휘적·구조적 단서에 의존하는 지름길 학습을 하고 있음을 밝혀냈습니다.
저자원 Tangkhul-English를 위한 신경망 기계 번역 (Neural Machine Translation)
인도 마니푸르 지역의 저자원 언어인 Tangkhul-English 간의 신경망 기계 번역 연구를 다룹니다. ByT5-large와 mT5-small 모델을 활용하여 성능을 비교하고, 데이터 부족 및 도메인 편향 문제를 분석합니다.
Sarashina2.2-TTS: 데이터 스케일링 및 타겟 데이터 합성을 통한 일본어 음성 생성에서의 한자 다음음(Kanji Polyphony)
Sarashina2.2-TTS는 일본어의 한자 다음(Kanji Polyphony) 문제를 해결하기 위해 설계된 LLM 기반 TTS 시스템입니다. 대규모 데이터 스케일링과 상용 한자를 포함한 타겟 데이터 증강을 통해 높은 읽기 정확도와 제로샷 화자 유사도를 달성했습니다.
표현이 중요하다: LLM 취약점 추론을 위한 프로그램 표현에 관한 실증적 연구
LLM을 활용한 프로그램 취약점 탐지 시, 원시 소스 코드와 정적 분석 기반의 프로그램 표현 방식이 추론 성능에 미치는 영향을 연구했습니다. 실험 결과, AST와 PDG를 결합한 구조적 표현이 원시 소스보다 훨씬 높은 정확도를 보임을 입증했습니다.
세 가지 불교 어휘: 경(Sutta), 율(Vinaya), 논(Abhidhamma)에 걸친 영어 팔리 경전의 계산 스타일로메트리
영어로 번역된 불교 삼장(Tipitaka) 전체를 대상으로 계산 스타일로메트리 분석을 수행한 연구입니다. Zipf 분포, 어휘 다양성(MATTR), 숫자-단어 밀도 등을 통해 경, 율, 논의 언어적 특성과 번역 간의 차이를 규명했습니다.
스토리 연산자: 임베딩 공간에서의 원작 $\to$ 속편 변환 분해
문학 작품을 임베딩 공간의 점으로 간주하여, 원작에서 속편으로의 변화를 기하학적 연산으로 분석하는 연구입니다. PCA를 통해 문학적 변환을 해석 가능한 축으로 분해하여 작품의 구조적 변화를 정량화합니다.
다국어 언어 모델을 위한 독성 탐지 및 완화 전략에 관한 조사
다국어 대규모 언어 모델(LLMs)의 독성 탐지 및 완화 전략을 종합적으로 조사한 연구입니다. 언어적·문화적 맥락에 따른 안전성 불균형 문제를 다루며, 다양한 위협 모델과 완화 기술을 분류합니다.
LibEvoBench: 코드 생성 모델의 시간적 지식 계층화 탐색
LibEvoBench는 API 버전 진화에 따른 LLM의 코드 생성 능력을 평가하는 새로운 벤치마크입니다. 연구 결과, 현재 모델들은 버전 간 차이를 구분하지 못하는 '버전 망각' 현상을 보이며, 문서 제공이 성능 향상에 필수적임을 밝혀냈습니다.
가중치 적용 부분 유사성을 이용한 프로젝트 단위 소프트웨어 버스마크 비교
본 논문은 프로젝트 단위의 소프트웨어 버스마크 비교를 통해 코드 표절 및 재사용을 탐지하는 새로운 프레임워크를 제안합니다. 가중치 부여 방식과 부분 유사도 메커니즘을 도입하여 부분 재사용과 부수적 유사성 문제를 효과적으로 해결합니다.
Hlava Cor 및 Hlava AD 코퍼스 소개: 상호 참조(Coreference) 및 담화 관계(Discourse Relations)에서의
체코어 텍스트의 상호 참조(Coreference) 및 담화 관계(Discourse Relations)를 분석하기 위한 두 개의 새로운 코퍼스를 소개합니다. 주석자 간의 불일치와 그 근거를 포함하여 텍스트 이해의 개인차와 모호성을 탐구합니다.
다음 관측 예측을 넘어: 순차적 의사결정을 위한 에이전트 주도형 월드 모델링 (Agent-Authored World Modeling)
LLM 에이전트의 월드 모델링을 위해 단순한 다음 관측 예측 대신, 에이전트의 의사결정에 필요한 역학을 포착하는 AAWM 방식을 제안합니다. 실험을 통해 의사결정 지향적 학습 목표가 기존 방식보다 더 효과적인 학습 신호를 제공함을 입증했습니다.
## 변경된 내용 - launch: [@hoyyeva]가 [#15434](https://github.com/ollama/ollama/pull
Ollama의 최신 업데이트 내역으로, Claude Code 자동 설치 지원 및 opencode의 thinking 기능 감지 기능이 추가되었습니다. 또한 추측 디코딩(speculative decoding) 통합과 Windows 환경에서의 Vulkan 및 CUDA 관련 최적화가 포함되었습니다.
확산 기반 TTS에서 급격한 운율 역학 모델링을 위한 적응형 진동 유도 편향 (Adaptive Oscillatory Inductive Bias)
확산 기반 TTS 모델의 급격한 운율 및 피치 변화 모델링 문제를 해결하기 위해 적응형 진동 유도 편향을 도입한 OscillaTTS를 제안합니다. 선형 바이패스를 통해 신호 안정성을 유지하며 제어 가능한 주기적 변조를 구현하여 음성 표현력을 높였습니다.
음성 및 텍스트 기반 대규모 언어 모델(LLM)의 일본어 방언 강건성 평가
본 연구는 일본어 방언을 대상으로 LLM과 SLM의 방언 강건성을 평가합니다. 실험을 통해 SLM의 강건성이 텍스트 기반 모델의 성능과 상관관계가 있음을 밝히고, 방언 데이터 학습 및 음성 인코더 미세 조정이 성능 향상에 기여함을 입증했습니다.
내가 랜딩 페이지 카피를 직접 쓰기를 그만둔 이유 (그리고 AI가 어떻게 더 빠른 반복을 도와주었는가)
랜딩 페이지 카피라이팅 과정에서 AI를 브레인스토밍 파트너로 활용하여 반복 작업 속도를 높이는 방법을 소개합니다. 단순한 결과물 생성이 아닌, 제약 조건을 활용한 대량의 아이디어 생성과 인간의 편집 과정을 결합하는 전략을 다룹니다.
PolicyAlign: 대규모 언어 모델(LLM)을 위한 직접적인 정책 기반 안전 정렬
PolicyAlign은 고품질 감독 데이터 없이 자연어 정책만으로 LLM을 안전하게 정렬하는 새로운 프레임워크를 제안합니다. 정책 위반 지시문을 합성하고 온-정책 자기 증류를 통해 모델의 안전성을 높이며, 일반적인 성능 저하를 최소화합니다.
번역 강화 음성 인코더 사전 학습이 Speech LLM에 영향을 미치는가?
Speech LLM 구축 시 발생하는 음성 인코더와 LLM 간의 구조적 불일치를 해결하기 위한 연구입니다. 음성 번역 목적 함수를 사전 학습에 통합하여 언어 불가지론적 표현을 학습함으로써 교차 모달 통합 성능을 개선합니다.
이 AI 방식을 시도하기 전까지 나는 로그 파싱에 수 시간을 허비했다
다양한 형식의 마이크로서비스 로그를 파싱하는 데 어려움을 겪던 저자가 LLM을 활용해 로그를 구조화된 데이터로 추출하는 방법을 소개합니다. 정규 표현식 대신 AI API를 사용하여 로그의 의미를 해석하고 JSON 객체로 변환하는 효율적인 워크플로우를 제안합니다.
효율적인 이슈 해결을 위한 적응형 멀티 에이전트 스캐폴딩(Adaptive Multi-Agent Scaffolding)을 통한 모델 잠재력 해방
복잡한 버그 해결을 위해 분산형 멀티 에이전트 스캐폴딩인 icat-agent를 제안합니다. 이슈 품질에 따라 워크플로우를 전략적으로 전환하여 컨텍스트 오염을 방지하고 모델의 잠재력을 극대화합니다.
LLM 에이전트의 하네스 설계와 사후 학습(Post-Training) 간의 상호작용
LLM 에이전트의 스캐폴딩인 하네스 설계와 사후 학습 간의 상호작용을 분석한 연구입니다. 하네스를 제어 가능한 설계 차원으로 취급하여, 환경 변화(OOD) 상황에서도 에이전트가 견고하게 적응할 수 있는 하네스 인지적 사후 학습의 중요성을 입증합니다.
이 피드 구독하기
본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.