Insights

AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.

TabSurv: 표본 데이터 생존 분석에 대한 현대적 신경망 아키텍처 적응

TabSurv는 표본 데이터 기반의 생존 분석(survival analysis) 문제를 해결하기 위해 현대적인 신경망 아키텍처를 적응시킨 새로운 방법을 제안합니다. 이 방법은 검열 데이터를 지원하는 히스토그램 손실 함수(SurvHL)를 최적화하며, 특히 앙상블 구성 요소를 병렬로 학습하여 예측 다양성을 극대화한 심층 앙상블을 구현했습니다. 다양한 실제 생존 데이터셋에서 테스트된 결과, TabSurv는 기존의 주요 딥러닝 및 고전 베이스라인 대비 일관되게 우수한 성능을 입증했습니다.

5월 6일11

arXiv논문

부정적 데이터베이스와 집단 공격을 가진 논증 프레임워크 간의 불일치

본 논문은 여러 무결성 제약 조건을 포함하는 불일치 데이터베이스에서 부분 최대 수리(subset-maximal repairs)와 논증 프레임워크 내의 허용 가능한 논증 집합 간의 새로운 연결을 제시합니다. 특히, 부정 제약과 국소적 관점 튜플 생성 의존성을 다루기 위해 SET 기반 논증 프레임워크(SETAFs)를 확장하고, 이들 하에서의 수리 개념이 선호 및 안정적 확장에 대응함을 증명했습니다. 또한, 특정 조건 하에서 이러한 불일치 데이터베이스의 수리를 일반적인 논증 프레임워크로 번역할 수 있음을 보여주었습니다.

5월 6일9

arXiv논문

비지도 전제 학습과 미세 조정 기반 항공 사진에서 효율적인 학교 탐지

본 논문은 수동 주석이 극도로 부족한 저데이터 환경에서 항공 사진을 이용해 학교를 효율적으로 탐지하는 약식 감독(weakly supervised) 프레임워크를 제안합니다. 이 방법은 희소 위치 점과 의미론적 분할을 활용하여 인프라 마스크를 생성하고, 이를 통해 경계 상자를 자동으로 라벨링하는 파이프라인을 구축합니다. 이후 2단계 학습 과정(자동 라벨링으로 사전 훈련 후 소수 수동 데이터로 미세 조정)을 거쳐 최소한의 감독만으로도 대규모 지역에서 강력한 학교 탐지 성능을 달성할 수 있음을 입증했습니다.

5월 6일9

arXiv논문

Feature-Augmented Transformers for Robust AI-Text Detection Across Domains and

본 논문은 다양한 도메인과 생성 파이프라인에서 발생하는 AI 생성 텍스트의 분포 이동(distribution shift)에 강건한 텍스트 검출기 개발을 목표로 합니다. 연구진은 트랜스포머 기반 모델에 어텐션 기반 언어적 특징 융합(attention-based linguistic feature fusion)을 추가하여 특징 증강(feature augmentation) 기법을 적용했습니다. 그 결과, 기존의 강력한 단일 임계값 검출기가 분포 이동 환경에서 취약성을 보였으나, 제안된 특징 증강 모델은 다중 도메인 및 생성기 벤치마크(M4)에서 높은 균형 잡힌 정확도를 달성하며 전이 성능을 크게 개선함을 입증했습니다.

5월 6일15

arXiv논문

Flow Sampling: 정규화되지 않은 밀도에서 샘플링 학습을 위한 분해능 조건부 과정

본 논문은 정규화되지 않은 밀도(unnormalized densities)에서 샘플링하는 문제를 다루며, 특히 에너지 함수로 정의된 목표 분포에 대한 효율적인 샘플러 학습 프레임워크인 Flow Sampling을 제안합니다. 이 방법은 확산 모델과 플로우 매칭을 결합하여 노이즈 샘플에 조건부되는 분해능 확산 드리프트(denoising diffusion drift)를 학습하는 것이 핵심입니다. 또한, 인터폴란트 과정을 활용하여 에너지 함수 평가 횟수를 최소화하고, 리만 다양체로의 확장성을 입증함으로써 다양한 기하학적 공간에서의 샘플링을 가능하게 합니다.

5월 6일7

arXiv논문

OpenSeeker-v2: 정보적이고 고난도 트래젝토리를 통해 검색 에이전트의 한계 돌파

OpenSeeker-v2는 정보적이고 고난도 트래젝토리를 활용한 데이터 합성 수정만으로, 기존에 자원 집약적인 CPT+SFT+RL 파이프라인을 거친 모델들을 능가하는 최상위 검색 에이전트 성능을 달성했습니다. 이 연구는 지식 그래프 및 도구 세트를 확장하고 엄격한 저 단계 필터링을 도입하여 강력한 기준선을 구축했으며, 10.6k 데이터 포인트만으로도 여러 벤치마크에서 최고 성능을 기록했습니다. 특히 OpenSeeker-v2는 순수 학술 팀이 SFT만을 사용하여 개발된 모델 중 최초로 이러한 성과를 보여주었으며, 그 가중치를 오픈소스로 공개하여 연구 커뮤니티의 접근성을 높이는 데 기여할 것입니다.

5월 6일17

arXiv논문

의도에서 실행까지: 에이전트 추천을 통한 에이전트 워크플로우 구성

본 논문은 사용자 의도에 따라 관련 응용 프로그램의 일련(워크플로우)을 설계하고 구축하는 다중 에이전트 시스템(MAS)의 자동 생성 프레임워크를 제안합니다. 기존 MAS 구축 과정에서 수동으로 이루어지던 계획 구성, 에이전트 선택, 실행 그래프 생성을 자동화하여 효율성을 높였습니다. 특히, LLM 기반의 에이전트 추천기(agent recommender)와 평가 에이전트를 도입하여 최적의 에이전트 조합을 찾아내고 전체 워크플로우를 종합적으로 검증하는 것이 핵심입니다.

5월 6일8

arXiv논문

제조업에서 추적 가능하고 위험에 대한 인식을 가진 인간-AI 의사결정 지원을 위한 물리 기반 다중 에이전트 아키텍처

본 기술 기사는 제조업의 고정밀 CNC 가공과 같은 복잡하고 위험도가 높은 환경에서 인간-AI 협업을 위한 새로운 물리 기반 다중 에이전트 아키텍처(MAKA)를 제안합니다. MAKA는 의도 라우팅, 정량적 분석 도구 사용, 지식 그래프 검색 등을 포함하는 여러 단계를 거치며, 각 단계마다 물리적 타당성 및 안전 한계에 대한 비평가 기반 검증을 강제하여 신뢰성을 높입니다. 이 아키텍처는 실제 로터 블레이드 가공 테스트베드에서 시뮬레이션되어, 기존의 단일 LLM 방식보다 훨씬 높은 성공률과 정밀도를 달성하며 위험 인식이 필요한 의사결정 지원에 효과적임을 입증했습니다.

5월 6일8

arXiv논문

경험 기반 검색 전략 오케스트레이션용 에이전트 지향 플러그인 경험 RAG 스킬

본 기술 기사는 기존 RAG 시스템의 한계점을 극복하기 위해 '경험 RAG 스킬(Experience-RAG Skill)'이라는 새로운 검색 오케스트레이션 레이어를 제안합니다. 이 스킬은 질문 유형과 현재 상황을 분석하고, 경험 기억을 바탕으로 최적의 검색 전략을 선택하여 에이전트에게 구조화된 증거를 제공합니다. 실험 결과, 이는 고정된 단일 검색기 기준선을 능가하며 적응형 RAG 스타일의 라우팅과 경쟁할 수 있음을 입증했습니다.

5월 6일8

arXiv논문

에이전트 시대의 AI 레드 팀링 재정의: 주에서 시간으로

본 기사는 AI 시스템의 취약점을 테스트하는 'AI 레드 팀링' 분야의 현황과 한계를 지적하며, 이를 혁신적으로 개선한 에이전트 기반 솔루션을 소개합니다. 기존 방식은 운영자가 공격 워크플로우를 수동으로 조립하고 관리하는 데 너무 많은 시간을 소요하게 하여 효율성이 떨어졌습니다. 필자들이 제안하는 새로운 에이전트는 Dreadnode SDK를 기반으로 하며, 자연어 인터페이스와 통합 프레임워크를 통해 복잡한 레드 팀링 작업을 자동화하여 운영자가 '무엇을' 탐지할지에 집중하고 '어떻게' 구현할지에 대한 부담을 덜어줍니다. 이로써 레드 팀링의 효율성을 주 단위에서 시간 단위로 압축하는 것을 목표로 합니다.

5월 6일7

arXiv논문

임상용 대형 언어 모델 (LLM) 의 안전성과 정확성은 다른 확장 법칙을 따른다

본 논문은 임상 환경에서 대형 언어 모델(LLMs)의 안전성과 정확성이 단순히 모델 규모를 키우는 것만으로는 보장되지 않음을 지적합니다. 연구진은 'SaFE-Scale' 프레임워크와 방사선 안전에 초점을 맞춘 'RadSaFE-200' 벤치마크를 개발하여, 다양한 배포 조건(예: 깨끗한 증거 제공, 모순 증거 처리)에서 LLM의 성능을 평가했습니다. 그 결과, 단순히 모델 크기를 키우거나 표준 RAG/에이전트형 RAG를 사용하는 것보다 '깨끗한 증거'가 가장 강력하게 안전성을 향상시키는 것으로 나타났으며, 임상용 LLM의 안전성은 배포 속성(증거 품질, 검색 설계 등)에 의해 결정됨을 강조합니다.

5월 6일10

arXiv논문

OracleProto: 지식 절단과 시간적 마스킹을 통한 LLM 네이티브 예측 능력 평가의 재현 가능한 프레임워크

본 논문은 대형 언어 모델(LLM)의 실시간 예측 능력을 객관적이고 재현 가능한 방식으로 평가하기 위한 프레임워크인 OracleProto를 제안합니다. 기존의 라이브 또는 후행 벤치마크 방식의 한계를 극복하는 이 프레임워크는, 시간적 마스킹과 지식 절단(knowledge cutoff)을 결합하여 모델이 실제로 '알지 못하는' 상황에서의 예측 품질을 측정할 수 있게 합니다. OracleProto를 통해 LLM의 예측 능력을 일회성 평가가 아닌, 감사 가능하고 재사용 가능한 데이터셋 수준의 능력으로 전환함으로써 공정한 비교와 다운스트림 학습에 활용할 수 있는 통제된 신호원을 제공합니다.

5월 6일9

arXiv논문

RoboAlign-R1: 로봇 비디오 월드 모델용 정교화된 멀티모달 보상 정렬

RoboAlign-R1은 기존 로봇 비디오 월드 모델의 한계를 극복하기 위해 보상 정렬 후 훈련과 안정화된 장기 추론 기법을 결합한 프레임워크입니다. 이 프레임워크는 RobotWorldBench라는 새로운 벤치마크와 멀티모달 스터디지 Judge를 활용하여 로봇의 명령어 수행, 조작 성공 등 실제 작업 일관성을 높이는 데 중점을 둡니다. 실험 결과, RoboAlign-R1은 기존 최고 성능 모델 대비 전반적인 평가 지표에서 유의미한 점수 향상을 보였으며, 특히 장기 예측 품질을 개선하는 SWR 기법도 효과적임을 입증했습니다.

5월 6일6

arXiv논문

ICASSP 2025 SDE 챌린지: 생성적 임펄스 응답 증강을 통한 화자 거리 추정 개선

본 기사는 ICASSP 2025의 화자 거리 추정(SDE) 챌린지에 참여하여, 생성적 임펄스 응답 증강을 통해 모델 성능을 개선하는 방법을 제시합니다. 연구진은 오픈 소스 FastRIR과 품질 필터를 활용하여 가상 환경에서 현실적인 Room Impulse Response (RIR) 데이터를 생성하고, 이를 이용해 SDE 모델을 미세 조정(fine-tuning)했습니다. 그 결과, 증강된 데이터셋이 특히 중거리 및 장거리 화자 거리 추정의 정확도를 크게 향상시키는 것을 입증했습니다.

5월 5일5

arXiv논문

이종 그래프 기반 모델의 강화: 결합되지 않은 관계 정렬을 통한 접근

본 논문은 다중 도메인 이종 그래프(MDHGs)에서 발생하는 특징 이동 및 관계 간극 문제를 해결하기 위해 '결합되지 않은 관계 서브스페이스 정렬(DRSA)'을 제안합니다. DRSA는 특징의 의미와 관계 구조를 분리하여, 공유된 저랭크 관계 서브스페이스 내에서 교차 타입 상호작용을 조정하는 새로운 메커니즘을 도입했습니다. 이를 통해 기존 방법들이 야기하던 '타입 붕괴' 및 '관계 혼동' 문제를 해결하고, 그래프 기반 모델의 다중 도메인 지식 전달 능력을 크게 향상시킬 수 있음을 입증합니다.

5월 5일10

arXiv논문

AI 와 오픈 데이터 기반 확장 가능한 태양광 발전량 프로파일링

본 논문은 오픈 데이터와 Foundation Vision AI 모델을 활용하여 도시 수준의 확장 가능한 태양광 발전량 프로파일링 프레임워크를 제시합니다. 이 프레임워크는 위성 이미지에서 태양광 패널의 기하학적 형태를 자동으로 탐지하고, 이를 지리 참조 인벤토리로 구축합니다. 또한 오픈 날씨 데이터를 통합하여 지역별 태양광 발전량 프로파일을 생성함으로써, 기존의 독점 데이터 및 수동 라벨링 의존도를 낮추고 투명하며 확장 가능한 에너지 분석 접근법을 제공합니다.

5월 5일15

arXiv논문

구조적 인과 의사결정 과정의 설계 및 구성

본 논문은 컴퓨팅 시스템의 경제학을 모델링하기 위해 두 가지 새로운 종류의 인과 의사결정 에이전트 모델, 즉 구조적 인과 의사결정 모델(SCDMs)과 이를 확장한 구조적 인과 의사결정 과정(SCDPs)을 제안합니다. SCDMs는 변수와 결정 간의 인과 관계를 명시적으로 표현하며, 특히 에이전트 결정이 특정 인과 전제 조건에 의해 제한될 수 있다는 점을 모델링할 수 있습니다. SCDP는 이러한 구조적 인과 의사결정 과정의 구성 가능성을 활용하여, 합리적 믿음 형식을 가정하지 않으면서도 기억 형성 및 변수 할인 같은 복잡한 동적 환경에서의 자원 합리성 에이전트 행동을 효과적으로 모델링할 수 있는 강력하고 표현력이 뛰어난 프레임워크를 제공합니다.

5월 5일9

arXiv논문

SemEval-2026 과제 10: 혼란 이론 탐지용 LLM 파인튜닝 (mdok 스타일)

SemEval-2026 과제 10은 Reddit 댓글의 혼란 이론(conspiracy theory) 믿음 여부를 탐지하는 것을 목표로 합니다. 이 시스템은 Qwen3-32B 모델을 사용하여 데이터 증강 및 자기 학습 기법으로 파인튜닝되었으며, 이진 텍스트 분류 작업에 적용되었습니다. 해당 접근 방식은 경쟁력 있는 성능을 보여주며, 기존의 기계 생성 텍스트 탐지 기술이 혼란 이론 탐지에도 효과적으로 활용될 수 있음을 입증했습니다.

5월 5일6

arXiv논문

주체성을 가진 AI 와 인간

이 논문은 인간의 주체성(agency)과 잠재적인 AI 프로그램의 주체성을 비교 분석합니다. 인간에게 주체성이 발현되는 과정은 전두엽 활성화에 수년이 걸리는 복잡한 과정을 거칩니다. 따라서 초기 LLM에 주체성을 부여하려는 시도는 상당한 어려움에 직면했으며, 진전하기 위해서는 실제 환경에서 행동과 계획을 인간 행위자와 함께 구축하는 새로운 구조가 필요합니다.

5월 5일13

arXiv논문

Caliper-in-the-Loop: 하이퍼레저 패브릭 성능 튜닝을 위한 블랙박스 최적화

본 논문은 수많은 구성 매개변수에 의존하여 수동 튜닝이 어려운 하이퍼레저 패브릭(Hyperledger Fabric)의 성능 최적화 문제를 다룹니다. 연구진은 이 문제를 블랙박스 최적화 문제로 간주하고, 차원 축소(DR)를 적용한 베이지안 최적화(BO)를 활용하여 자동화된 튜닝 파이프라인을 개발했습니다. 구현된 Caliper-in-the-loop 시스템은 실제 테스트베드에서 기존 방식 대비 높은 트랜잭션 처리량(TPS) 개선 효과를 입증하며, 고차원 복잡계 시스템의 성능 최적화에 실용적인 접근법임을 제시합니다.

5월 5일5

이 피드 구독하기

RSSFeedly, Inoreader 등으로 구독

API/api/search?q=검색어

AIllms.txt로 AI 크롤링 가이드