Get Started
노드 사용법 익히기 - PDF 텍스트 리더(PDF Text Reader) 노드
이 튜토리얼에서는 에이전트리아(Agentria) 의 PDF 텍스트 리더(PDF Text Reader) 노드 사용법을 안내합니다. PDF 텍스트 리더 노드는 PDF 파일에서 텍스트 콘텐츠를 추출하여 문자열로 반환합니다. '파일 처리 도구' 카테고리에 속하며, 다양한 파일 형식에 맞는 리더 노드를 함께 제공합니다.
이 튜토리얼에서는 PDF 파일을 업로드하면 텍스트를 추출하여 반환하는 'PDF 텍스트 추출' 워크플로를 완성합니다.
사전 준비
에이전트리아 캔버스 진입 방법은 🔗3단계 핵심 가이드를 참고하시기 바랍니다.
이 튜토리얼을 완료하면 다음을 수행할 수 있습니다.
PDF 텍스트 리더 노드를 설정하여 PDF 파일에서 텍스트를 추출할 수 있습니다.
파일 입력을 받아 텍스트를 반환하는 워크플로를 구성할 수 있습니다.
워크플로 개요
전체 흐름: 시작 노드 → PDF 텍스트 리더 노드 → 종료 노드
이 튜토리얼의 핵심은 PDF 텍스트 리더 노드입니다.
PDF 텍스트 리더 노드는 연결된 PDF 파일에서 텍스트 콘텐츠를 추출하고 문자열로 반환합니다. 이미지나 표 등 텍스트 이외의 요소는 추출 대상에서 제외됩니다.
PDF 텍스트 리더 노드는 '파일 처리 도구' 카테고리에 속합니다. 처리할 파일 형식에 따라 아래 노드를 함께 활용할 수 있습니다.
노드 | 지원 형식 | 반환 형식 |
|---|---|---|
| .pdf, .docs, .pptx, .png | 문자열 |
| .xlsx, .xls | 헤더, 행, 행 개수 |
| .csv | 헤더, 행, 행 개수 |
| .json | 객체/배열 |
| .txt, .log, .md, .csv | 문자열 |
| .docx | 마크다운 |
| .hwpx | 마크다운 |
| .html | 마크다운 |
1단계: 인풋 변수 선언 (시작 노드)
시작 노드를 더블 클릭하여 노드 편집기(Node Editor)를 엽니다.
인풋 영역(Input Section)에 다음 변수를 추가합니다.
변수명 | 타입 |
|---|---|
| file |
pdf_file은 텍스트를 추출할 PDF 파일입니다.
2단계: PDF 텍스트 리더 노드 추가
캔버스에서 +노드 추가(Add Node)를 클릭합니다. '파일 처리 도구' 카테고리에서 PDF 텍스트 리더 노드를 추가합니다. 노드 이름을 PDF 읽기로 변경합니다.
3단계: PDF 텍스트 리더 노드 설정
PDF 읽기 노드를 더블 클릭하여 노드 편집기를 엽니다.
PDF 텍스트 리더 노드는 아래 항목을 제공합니다.
항목 | 필수 여부 | 설명 |
|---|---|---|
| 필수 | 텍스트를 추출할 PDF 파일. 단일 파일만 입력 가능. 시작 노드의 file 타입 변수를 드래그 앤 드롭으로 연결 |
인풋 영역의 file 항목에 시작 노드의 pdf_file 변수를 드래그 앤 드롭으로 연결합니다.
아웃풋 영역에서 추출된 텍스트가 문자열 변수로 반환되는 것을 확인합니다.
여러 PDF를 처리하려면 PDF 텍스트 리더 노드를 파일 수만큼 병렬로 배치하고, 병합(Merge) 노드로 결과를 합칩니다.
4단계: 엣지로 노드 연결
캔버스에서 아래 순서로 엣지(Edge)를 연결합니다.
시작 노드의 아웃핀(Out-Pin) →PDF 읽기노드의 인핀(In-Pin)PDF 읽기노드의 아웃핀 →종료 노드의 인핀
5단계: 종료 노드 설정
종료 노드를 더블 클릭하여 노드 편집기를 엽니다.
인풋 영역에 추출된 텍스트 변수를 추가하고, PDF 읽기 노드의 아웃풋 변수를 드래그 앤 드롭으로 연결합니다.
6단계: 어빌리티 테스트로 워크플로 전체 실행
캔버스 상단의 테스트(TEST) 버튼을 클릭하여 어빌리티 테스트(Ability Test)를 실행합니다.
pdf_file 항목에 텍스트가 포함된 PDF 파일을 업로드한 뒤 테스트 실행(RUN TEST)을 클릭합니다.
종료 노드의 아웃풋에서 PDF에 포함된 텍스트가 문자열로 반환되는 것을 확인합니다.
다음 단계
🎉 축하합니다! 에이전트리아를 사용해 'PDF 텍스트 추출' 워크플로를 완성했습니다.
추출된 텍스트를 AI 모델 노드에 연결하여 요약·분류·질의응답 등 다양한 문서 처리 워크플로로 확장할 수 있습니다. 여러 PDF를 동시에 처리하려면 PDF 텍스트 리더 노드를 병렬로 배치하고 병합(Merge) 노드로 결과를 합치는 구성을 활용하시기 바랍니다.
에이전트리아는 아이디어를 현실로 바꾸는 가능성의 공간입니다.
당신의 상상력으로 워크플로는 무한히 확장될 수 있습니다.