Sheet as Token 프레임워크: 그래프 증강 방식을 이용한 다중 테이블 스프레드시트의 이해 및 검색 구현
요약
Sheet as Token 프레임워크는 그래프 증강 방식을 활용하여 다중 테이블 스프레드시트의 이해와 검색을 구현합니다. 이중 인코더를 통한 테이블 표현 학습과 그래프 리트리버를 이용한 교차 테이블 검색의 2단계 과정을 거칩니다.
핵심 포인트
- 이중 인코더를 사용한 테이블 표현 학습
- 그래프 증강 기반의 교차 테이블 검색 구현
- Stage 1 학습 후 Stage 2에서 모델 동결 방식 적용
- 다중 테이블 스프레드시트 검색 최적화
Sheet as Token 프레임워크, 그래프 증강 (graph augmentation) 방식을 사용하여 다중 테이블 스프레드시트 (multi-table spreadsheets)의 이해와 검색을 구현합니다.
https://
gitub.com/xiaoqi-7/Sheet
asToken
...
SheetasToken은 논문 "Sheet as Token"의 공식 코드입니다.
두 단계로 나뉩니다:
Stage 1: 이중 인코더 (dual encoders)를 사용하여 테이블 표현 (table representations)을 학습합니다 (예시 포함/미포함 컬럼의 두 가지 유형으로 구분).
Stage 2: 교차 테이블 검색 (cross-table retrieval)을 위해 그래프 리트리버 (graph retriever)를 사용합니다 (베이스라인과 그래프 증강의 두 가지 유형으로 구분).
최종 모델은 Stage 1 with_example + Stage 2 enhanced 조합이며, Stage 2 학습 동안 Stage 1은 동결 (frozen)됩니다. 저장소에는 전체 학습 스크립트, 설정 및 데이터 형식 지침이 포함되어 있습니다.
React와 같은 UI 프레임워크 없이도 웹 페이지에 만화 브라우저를 임베딩할 수 있는 오픈 소스 TypeScript/JavaScript 만화 리더 라이브러리입니다.
https://
gitub.com/yui540/comimi
TypeScript로 작성되었으며, React와 같은 프레임워크에 의존하지 않고 독립적으로 실행될 수 있습니다. Using the
AI 자동 생성 콘텐츠
본 콘텐츠는 X @qingq77 (자동 발견)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기