
X(트위터)의 콘텐츠 재게시 블로거들의 소스가 어디인지 드디어 알아냈습니다!
요약
MediaCrawler는 Xiaohongshu, Douyin, Bilibili 등 다양한 중국 플랫폼의 콘텐츠를 수집할 수 있는 통합 도구입니다. JS 역공학 없이 브라우저 로그인 세션을 활용하여 데이터 접근 장벽을 낮춘 것이 특징입니다.
핵심 포인트
- 다양한 중국 소셜 미디어 플랫폼을 지원하는 단일 도구
- JS 역공학 없이 브라우저 세션으로 서명 획득 가능
- Python 기초 지식만 있으면 누구나 사용 가능한 낮은 진입 장벽
- 학습 및 연구 목적으로만 사용 권장
드디어 X/Twitter에서 콘텐츠를 퍼오는 블로거들의 소스가 어디인지 알아냈습니다!
MediaCrawler라는 도구인데, Xiaohongshu, Douyin, Kuaishou, Bilibili, Weibo, Tieba, Zhihu를 모두 아우르는 단일 도구입니다. 공개된 게시물, 댓글, 좋아요, 재게시(reposts)를 모두 긁어올 수 있습니다.
가장 놀라운 점은 JS 역공학 (JS reverse engineering)을 할 필요가 없다는 것입니다. 브라우저의 로그인 세션 (login session)을 사용하여 직접 서명 (signatures)을 가져옵니다. 진입 장벽이 즉시 낮아져서, Python을 조금만 할 줄 안다면 누구나 실행할 수 있습니다.
물론, 저자는 이를 매우 명확히 밝히고 있습니다: 학습 및 연구 목적으로만 사용해야 하며, 불법적인 용도로 사용하지 마십시오.
https://github.com/NanmiCoder/MediaCrawler
...
최근 X가 재게시 유형에 대해 단속을 할 수도 있으니, 모두 적절히 사용해야 합니다!
AI 자동 생성 콘텐츠
본 콘텐츠는 X @nftcps (자동 발견)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기