© 2026 Molayo

Insights

AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.

합성곱 신경망 (CNN) 및 동적 S-Box 생성을 기반으로 한 이미지 암호화 알고리즘

CNN과 동적 S-Box 생성을 결합하여 이미지 암호화의 보안성을 높이는 새로운 알고리즘을 제안합니다. 학습된 특성을 기반으로 적응형 S-Box를 생성함으로써 기존 고정형 방식보다 높은 비선형성과 공격 저항력을 제공합니다.

이해 없는 보정: 시스템 소프트웨어 취약점 탐지를 위한 LLM 미세 조정(Fine-Tuning)의 한계 진단

LLM의 시스템 소프트웨어 취약점 탐지 능력을 분석한 연구로, 미세 조정이 근본적인 보안 추론 능력을 향상시키기보다 단순한 출력 분포 조정에 그친다는 점을 밝혀냈습니다. CWE-Trace 프레임워크를 통해 데이터 오염의 영향이 미미하며, 모델의 사전 확률이 미세 조정을 압도한다는 사실을 증명했습니다.

대규모 언어 모델(LLMs)이 항상 읽기 쉬운 언어를 필요로 하는 것은 아니다

LLM이 인간의 가독성을 희생하는 대신 의미 정보를 압축하여 전달할 수 있는 'BabelTele'라는 모델 중심적 텍스트 표현 방식을 제안합니다. 연구 결과, 텍스트를 27.9%로 압축해도 99.5%의 의미 충실도를 유지하며 컨텍스트 오버헤드를 줄일 수 있음을 확인했습니다.

코딩 에이전트를 위한 저장소 가이드(Repository Guidance)의 탐색 및 정제 튜닝 (Probe-and-Refine Tuning)

코딩 에이전트의 성능을 높이기 위해 저장소 가이드(Repository Guidance)를 생성하고 최적화하는 '탐색 및 정제 튜닝(Probe-and-Refine Tuning)' 기법을 제안합니다. 실험 결과, 이 방식은 에이전트가 올바른 파일에 접근하도록 도와 해결률을 유의미하게 향상시켰습니다.

대규모에서의 생성형 엔진 최적화: AI 검색 엔진 전반의 브랜드 가시성 측정

AI 검색 엔진(ChatGPT, Perplexity 등)에서 브랜드 가시성을 측정하는 GEO(생성형 엔진 최적화) 연구 결과를 발표합니다. 브랜드 규모에 따른 노출 차이와 인용되는 주요 출처 및 콘텐츠 형식을 분석하여 AI 시대의 새로운 마케팅 기준선을 제시합니다.

REDACT: 개인정보(PII) 탐지를 위한 체계적으로 제어된 다국어 벤치마크

개인정보(PII) 탐지 성능을 체계적으로 평가하기 위한 다국어 벤치마크인 REDACT를 제안합니다. 25개 언어와 51개 엔티티 유형을 포함하며, 다양한 생성 축을 통해 기존 탐지기들의 한계를 정밀하게 분석합니다.

거의 지능적인 혁명: 숙의(Deliberation)의 규모 확장 및 AI를 통한 인간 역량 강화 방안

LLM이 민주적 숙의 과정에 미치는 영향과 이를 통해 숙의의 규모를 확장하고 민주화하는 방안을 탐구합니다. 언어적 편향과 불평등을 완화하며 포용성을 높이기 위한 AI의 역할과 윤리적 안전장치 구축의 필요성을 다룹니다.

다중 에이전트 거래적 기억 (Multi-Agent Transactive Memory)

다양한 LLM 에이전트들이 생성한 결과물(궤적)을 공유하고 재사용할 수 있는 MATM 프레임워크를 제안합니다. 에이전트 간의 지식 공유를 통해 새로운 에이전트가 기존의 해결책을 반복 학습하지 않고도 작업 성능을 높일 수 있습니다.

이산 음성 토큰의 놀람도(Surprisal)를 이용한 경량 발음 평가

원어민 음성 데이터만으로 학습 가능한 비지도 방식의 경량 발음 평가 프레임워크를 제안합니다. 이산 음성 토큰의 놀람도(Surprisal)와 정렬 특징을 결합하여 지도 학습 없이도 높은 성능의 발음 평가를 구현했습니다.

GEMS: 기하학적 제약이 LLM의 다중 의미 중첩을 가능하게 함

LLM의 추론 시점에 은닉 상태를 수정하는 Activation Steering 기술에서 발생하는 모델 붕괴 문제를 해결하기 위한 GEMS 방법론을 제안합니다. 분포 편차와 방향 간섭이라는 두 가지 원인을 기하학적 제약 조건으로 해결하여 다중 의미 중첩을 가능하게 합니다.

음향 및 운율 섭동을 통한 음성 품질 평가에서의 인간-모델 불일치 조사

TTS 품질 평가 모델인 MOS 예측 모델이 인간의 지각과 어떻게 다른지 조사한 연구입니다. 모델은 음향적 저하는 잘 포착하지만, 운율적 오류와 화자 특성 변화에는 인간보다 둔감한 한계를 보입니다.

대조 학습 (Contrastive Learning)을 결합한 오토인코더 (Autoencoder) 기반의 세그먼트 수준 중국어 음성 인지 기능

대조 학습과 오토인코더를 결합하여 제한된 라벨링 데이터 환경에서도 견고한 음성 기반 인지 기능 저하 탐지 프레임워크를 제안합니다. 중국어 음성 데이터셋 실험을 통해 세그먼트 수준의 표현 학습이 임상적 분류 성능을 효과적으로 향상함을 입증했습니다.

Text-to-JSON 학습을 위한 소스 기반 데이터 생성

비정형 문서에서 JSON 구조를 추출하기 위한 새로운 데이터 생성 파이프라인인 STAGE를 제안합니다. 스프레드시트를 기반으로 정답 값을 검증하여 신뢰할 수 있는 학습 데이터를 합성하며, 기존 방식 대비 모델의 추출 성능을 대폭 향상시켰습니다.

HydraHead: 헤드 수준의 기능적 이질성으로부터의 특화된 어텐션 하이브리드화

HydraHead는 레이어 단위가 아닌 헤드 단위로 Full Attention과 Linear Attention을 결합하는 새로운 하이브리드 어텐션 아키텍처를 제안합니다. 해석 가능성 분석을 통해 검색에 중요한 헤드를 식별하고, 스케일 정규화 융합 모듈을 통해 효율적인 성능 향상을 달성합니다.

스트리밍 도구 사용은 언제 도움이 되는가? 스트리밍 검색 증강 생성 (Streaming RAG)에서의 도구 의도 안정화 특성 분석

사용자의 입력이 완료되기 전 도구 쿼리를 미리 발행하여 지연 시간을 줄이는 Streaming RAG의 '도구 의도 안정화' 특성을 분석한 연구입니다. CRAG 벤치마크를 통해 도구 지연 시간과 입력 속도에 따른 지연 시간 은닉 가능성을 모델 불가지론적 상한으로 도출했습니다.

검증 가능한 지시 이행 수정(Instruction-Following Revision)에서 자기 선호(Self-Preference)는 약하거나

LLM이 자신의 생성물을 검토할 때 발생하는 자기 선호 편향(self-preference bias)을 IFEval 환경에서 검증했습니다. 연구 결과, 모델은 결정론적 검증기에 의해 확인된 양질의 수정안을 거부하지 않으며, 자기 선호 편향이 실질적으로 존재하지 않음을 발견했습니다.

ReNikud: 오디오 지도 학습 기반의 히브리어 자소-음소 변환 (Grapheme-to-Phoneme Conversion)

ReNikud는 모음 표기가 생략되는 히브리어의 특성을 극복하기 위해 오디오 지도 학습을 활용한 새로운 G2P 방법론을 제안합니다. ASR 의사 레이블링과 문자 수준 정렬을 통해 자연스러운 구어 발음을 반영하며, 기존 SOTA 모델보다 뛰어난 성능을 입증했습니다.

NAMESAKES: 텍스트-이미지(Text-to-Image) 모델의 정체성 암기(Identity Memorization) 조사

텍스트-이미지 모델이 특정 인물의 정체성을 암기하여 생성하는지 여부를 판별하는 블랙박스 행동 프로브 연구를 소개합니다. 참조 사진이나 학습 데이터 없이도 암기 여부를 구분할 수 있는 NAMESAKES 데이터셋을 제안합니다.

음높이 표기(Pitch Spelling) 재즈 리드 시트, 솔로 채보, 클래식 피아노 및 단선율 악보

MIDI 데이터를 기반으로 음높이 표기(Pitch Spelling)와 조성을 추정하는 새로운 알고리즘을 제안합니다. 최단 경로 탐색과 최적화 과정을 통해 임시표를 최소화하고 정확한 조표 및 음계를 도출합니다.

CzechDocs: 체코 내 소수 언어를 위한 서식 지정 문서의 다방향 병렬 데이터셋

체코어 및 소수 언어의 서식(HTML, DOCX, PDF)을 보존하는 다방향 병렬 데이터셋인 CzechDocs를 소개합니다. 기계 번역 시스템이 문서의 레이아웃을 유지하며 번역하는 능력을 평가하고 연구할 수 있도록 설계되었습니다.

이 피드 구독하기

RSSFeedly, Inoreader 등으로 구독

API/api/search?q=검색어

AIllms.txt로 AI 크롤링 가이드

본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.