anuano.com 정보
필요에 따라 구축되어 커뮤니티와 공유됩니다. 문서 변환 도구 뒤에 숨겨진 이야기는 다음과 같습니다.
우리가 시작한 방법
이름이 궁금하실텐데요. "anu-ano"는 필리핀어(타갈로그어)로 "무엇" 또는 "무엇이든"을 의미한다고 들었습니다. 실제로 모든 것을 깨끗하고 사용 가능한 데이터로 변환하는 데 도움을 주는 우리 업무에 딱 맞는 이름입니다.
이 프로젝트는 우리가 자체 웹 애플리케이션을 개발하는 동안 시작되었습니다. AI 통합을 많이 실험하면서 우리는 LLM이 데이터를 안정적으로 추출할 수 있도록 고품질 Markdown 파일이 필요하다는 것을 깨달았습니다. 우리는 엄격한 요구 사항을 충족할 수 있는 사내 도구를 원했습니다.
우리는 간단한 HTML을 Markdown으로 변환하는 변환기를 만드는 것부터 시작했습니다. 얼마 지나지 않아 우리는 Word 파일, Excel 스프레드시트, PowerPoint 프리젠테이션은 물론 OCR을 통해 이미지에서 텍스트를 추출하는 등 거의 모든 주요 문서 유형을 처리할 수 있도록 처리 엔진을 확장했습니다.
우리는 자체 AI 실험 때문에 이 도구가 필요했습니다. 우리는 LLM(Large Language Model)이 Markdown에서 훨씬 더 잘 작동한다는 것을 금방 알게 되었습니다. 명확한 의미 구조를 제공할 뿐만 아니라 원시 HTML이나 시끄러운 PDF에 비해 토큰 소비를 대폭 절감합니다.
우리는 자체 AI 실험 때문에 이 도구가 필요했습니다. 우리는 LLM(Large Language Model)이 Markdown에서 훨씬 더 잘 작동한다는 것을 금방 알게 되었습니다. 명확한 의미 구조를 제공할 뿐만 아니라 원시 HTML이나 시끄러운 PDF에 비해 토큰 소비를 대폭 절감합니다.
Markdown은 컴팩트하고 고도로 구조화되어 있어 사람과 기계 모두가 이해하기 쉽습니다.
제목
문서 계층 구조를 정의합니다.
기울기
지도 관계 및 단계
테이블
구조화된 데이터 구성
모래밭
참조 및 인용 제공
코드 블록
재현 가능한 코드 예제 유지
이것이 바로 anuano.com이 복잡한 문서를 깔끔한 마크다운으로 전환하여 모든 AI 워크플로우에서 검색, 삽입, 청크, 요약 및 재사용을 훨씬 쉽게 만들어주는 이유입니다.
사용 사례 및 다음 단계
우리의 사용 사례
우리는 이 엔진이 현재 개발 중인 상용 솔루션에 직접적으로 적합했기 때문에 이를 구축했습니다. 우리는 내부 송장 생성기, 계약 생성기 및 재무 감사자를 위한 포괄적인 감사 제품군을 위한 데이터 추출을 지원하기 위해 이 정확한 기술을 사용합니다.
다음은 무엇입니까?
우리의 여정은 여기서 끝나지 않습니다. 우리는 역방향 Markdown to HTML 변환기를 만들 계획을 적극적으로 계획하고 있습니다. 시간이 지나면 Markdown을 세련된 PDF 문서로 직접 내보내는 등 더 많은 변환 도구를 포함하도록 플랫폼을 확장할 수 있기를 바랍니다.
맞춤형 통합을 찾고 계십니까?
귀하의 비즈니스에 일괄 처리, 보안 API 액세스 또는 귀하의 데이터 요구 사항에 특별히 맞춰진 맞춤형 파이프라인이 필요한 경우 우리는 협력하고 싶습니다.
일괄 처리
더 빠른 라우팅을 통해 수천 개의 문서를 비동기식으로 처리합니다.
API 액세스
기존 RAG 파이프라인 및 워크플로에 직접 통합됩니다.
우리가 도구를 만드는 동안 즐거웠던 만큼 여러분도 도구를 사용하여 즐거운 시간을 보내시기 바랍니다!