Document-Knowledge-Mining-Solution-Accelerator
Azure OpenAI Service와 Azure AI Document Intelligence를 기반으로 구축된, 비정형, 다중모드 문서에서 요약, 엔터티, 메타데이터를 처리하고 추출하여 데이터를 검색하고 채팅할 수 있는 솔루션.
아키텍처 그림
실제 엔터티 추출 : 사람, 제품, 이벤트 장소 또는 행동과 같은 고유한 정보를 처리하고 추출
채팅 기반 Insight discovery : 모든 인덱싱 된 assets, 단일 assets, 선택한 assets 세트 또는 사용자 주도 키워드 검색을 기반으로 생성된 asset 목록과 채팅 가능
텍스트 및 문서 데이터 분석 : 문서, 손글씨 텍스트, 차트, 그래프, 표 및 양식 필드를 포함한 다중 모드 문서의 내용을 분석, 비교 및 요약하여 심층적인 통찰력을 제공
프롬프트 제안 가이드 : 프롬프트 문의를 기반으로 다음 질문 세트를 제안
다중 모드 정보 처리 : 여러 콘텐츠 유형과 다양한 형식의 지식을 처리하고 추출
대량의 데이터를 신속하게 분석하고, 관련 제안을 생성하여 빠르고 쉽게 추론할 수 있도록 도와준다.
Prerequisites
Powershell 설치
1 | % brew install powershell/tap/powershell |
macOS에 Azure CLI 설치
1 | $ brew update && brew install azure-cli |
kubectl 설치
1 | % sudo az aks install-cli |
aks-preview 설치
Azure CLI의 extension으로서 AKS를 운영할 수 있다.
1 | % az extension add --name aks-preview |
Helm 설치
k8s의 패키지 매니저이다.
1 | % brew install helm |
Docker Desktop 설치
서비스를 컨테이너화 하고 Azure Container Registry로 배포하기 위하여 도커 데스크탑을 설치한다.
Deploy script를 실행하기 전에 도커 데스크탑이 실행중인지 확인 필요하다.
Azure Access
subscription-level이 Owner나 User Access Administrator role로 필요하다.
Regional Availability
Azure 서비스와 모델이 지역별로 제공 여부가 제한된다.
Azure Open AI (GPT-4o mini)
- 사용 모델 : 이 솔루션은 GPT-4o mini와 text-embedding-3-large 모델을 사용한다.
- 제공 지역 : 해당 모델들은 현재 다음 지역에서만 사용 가능
- West US3
- East US
- East US2
- SwedenCentral
Azure AI Document Intelligence
- 사용 API 버전 : 이 솔루션은 2023-10-31-preview 또는 그 이후 버전의 Document Intelligence를 사용한다.
- 제공 지역 : 현재 해당 API는 East US 지역에서만 사용 가능하다.
- 배포 지역 제한 : 이 모델은 반드시 East US 지역에 배포 되어야 한다.
Deployment
자동화 된 배포 단계
- Azure 리소스 배포
- Azure 리소스에서 Secrets 가져오기
- 애플리케이션 Config 파일에 Secrets 업데이트
- Azure App Configuration에 Application Config 설정
- 애플리케이션 컴파일, 이미지 빌드 및 Azire Container Registry에 푸시
- k8s 클러스터 인프라 구성
- k8s 구성 파일 업데이트
- 인증서, 인그레스 컨트롤러, 애플리케이션 이미지를 ACR에서 배포
Deployment Script 실행
1 | % git clone https://github.com/microsoft/Document-Knowledge-Mining-Solution-Accelerator.git |
실행 시 에러 발생
1 | _____ _ |
Reference
Knowledge Mining/Conversation knowledge mining solution accelerator
Document-Knowledge-Mining-Solution-Accelerator
https://hamin7.github.io/2024/12/17/Document-Knowledge-Mining-Solution-Accelerator/
install_url
to use ShareThis. Please set it in _config.yml
.