LLM · RAG · 대화형 AI · AI Agent 기반으로 공공/엔터프라이즈 업무에 즉시 적용 가능한 생성형 서비스 아키텍처를 설계·구축·고도화합니다.
LLM 실행 | 클라우드 API(OpenAI/Google/Anthropic 등) 또는 온프레미스(vLLM, TGI, Triton), 엔진 교체/모델 라우팅 |
---|---|
RAG/검색 | Embedding(E5, bge 등), Vector DB(Milvus/pgvector/Weaviate), Hybrid 검색(BM25+ANN), Fusion·Re-ranking |
오케스트레이션 | LangGraph/Agent, MCP(Server/Client), A2A(REST/gRPC/DB/ESB), 가드레일(프롬프트·툴 정책) |
옵저버빌리티 | OpenTelemetry, Prometheus/Grafana, 대화 로그/트레이스/메트릭, 피드백 루프 |
보안 | SSO/OIDC, RBAC/ABAC, Vault/KMS, PII 마스킹/토큰화, 전 구간 감사 |
클라이언트 | 웹(React/Next), 챗 위젯, 업무포털 연동 |