MAIA미디어 AI 엔진 · Media AI Agent

방송을 위한 AI 엔진 스위트

MAIA(Media AI Agent)는 영상 · 음성 · 얼굴 · 문자 · 프롬프터를 AI로 분석하는 통합 엔진입니다. 방대한 미디어 라이브러리를 검색 가능한 자산으로 바꿉니다.

문의하기

온프레미스 배포 — 콘텐츠가 시설 밖으로 나가지 않습니다

MAIA AI 기술 화면
핵심 기능

AI 기술에 필요한 모든 것

MAIA Video — 장면 이해

AI

프레임 → 샷 → 장면 단위로 영상을 분할하고 각 장면의 내용을 텍스트화해 검색 가능한 메타데이터로 저장합니다.

MAIA Speech — 음성 인식(STT)

AI

Google · Amazon · Naver Clova · Whisper 등 다중 STT 엔진과 화자 분리로 모든 발화를 검색 가능한 텍스트로 변환합니다.

MAIA Face — 얼굴 인식

AI

영상 속 인물을 자동 추출 · 군집화하고, 사진 한 장으로 전체 아카이브에서 해당 인물의 모든 등장을 찾습니다.

MAIA Character — 문자 인식(OCR)

AI

자막·하단 자막·CG 등 화면 속 텍스트를 감지해 검색 가능한 형태로 색인합니다.

MAIA Object — 객체 인식

AI

133종의 객체를 감지하여 장면 단위의 영상에 대해 구조화된 메타데이터를 생성합니다.

MAIA Prompter — AI 프롬프터

AI

AI가 진행자의 음성을 실시간으로 스크립트와 매칭해 자동으로 스크롤합니다. 별도 오퍼레이터가 필요 없습니다.

자연어 통합 검색

AI

얼굴 · 객체 · STT · 장면 데이터를 통합하여 일상 언어로 아카이브를 검색합니다.

기능 상세

다섯 개의 엔진, 하나의 MAIA

MAIA Video 장면 인식 화면

장면 인식

Scene Change Detection

AI가 영상을 프레임 → 샷 → 장면 단위로 자동 분할하고, 각 구간을 구조화된 메타데이터로 정리합니다. 온프레미스로 동작해 콘텐츠가 시설 밖으로 나가지 않습니다.

  • 01객체 감지
    사람 · 차량 · 동물 · 배경 등 116종 이상을 파놉틱 세그멘테이션으로 분류하고 자동 태깅합니다.
  • 02영상 요약 · 장면 설명
    생성형 AI가 장면마다 사람이 읽을 수 있는 설명을 자동으로 작성합니다.
  • 03자연어 검색
    얼굴 · 객체 · STT · 장면 데이터를 통합해 일상 언어로 아카이브를 검색합니다.
MAIA Speech 음성 인식 (STT) 화면

음성 인식 (STT)

Speech-to-Text

방송에서 발화된 모든 말이 자동으로, 정확하게, 실시간으로 검색 가능한 텍스트가 됩니다.

  • 01다중 STT 엔진 허브
    Google · Amazon Transcribe · Naver Clova · OpenAI Whisper · Daglo를 선택해 적용합니다.
  • 02화자 분리(diarization)
    누가 언제 말했는지 타임코드와 함께 식별합니다.
  • 03자막 내 키워드 검색으로 편집 지점을 즉시 찾아가고, AI 자막 편집 · 자동 요약 · 자막 파일 다운로드를 지원합니다.
  • 04클라우드 SaaS(사용량 과금) 또는 Whisper 기반 완전 온프레미스로 배포합니다.
MAIA Face 얼굴 인식 화면

얼굴 인식

Face Recognition

출연자의 모든 등장 장면을 전체 아카이브에서 몇 시간이 아닌 몇 초 만에 찾습니다.

  • 01얼굴 자동 추출
    랜드마크 분석으로 얼굴을 감지하고 동일 인물을 자동으로 군집화합니다.
  • 02이미지 기반 검색
    사진 한 장을 올리면 일치하는 모든 등장 장면을 즉시 찾습니다.
  • 03인물 타임라인
    인물별 등장 구간을 샷 단위 시각 타임라인으로 보여 줍니다.
MAIA Character 문자 인식 (OCR) 화면

문자 인식 (OCR)

OCR Detection

하단 자막, 채널 로고(chyron), 화면 속 그래픽 텍스트까지 자동으로 감지 · 색인 · 검색합니다.

  • 01전체 분석 모드
    화면 속 모든 텍스트 영역을 별도 설정 없이 자동으로 감지합니다.
  • 02영역 선택 모드
    드래그로 관심 영역을 지정해 원하는 위치만 정밀하게 추출합니다.
  • 03한글 · 영문 · 중국어 · 일본어 등 다국어와 다양한 폰트를 지원합니다.
MAIA Prompter AI 프롬프터 화면

AI 프롬프터

AI-Powered Live Prompting

진행자의 음성을 듣고 스크립트와 실시간으로 맞춰 자동으로 스크롤하는 프롬프터입니다.

  • 01실시간 음성 매칭
    진행자의 발화를 분석해 스크립트 위치를 자동으로 따라갑니다.
  • 02오퍼레이터 불필요
    전담 운영 인력 없이 완전 자동으로 스크롤합니다.
  • 03온프레미스 · 클라우드(Whisper Live 포함)로 배포합니다.
작동 방식

한 흐름으로 이어지는 워크플로우

01수집
02AI 분석 (영상 · 음성 · 얼굴 · 문자)
03메타데이터 · 색인
04자연어 검색
05활용 · 재사용
성과 · 사양

검증된 기술, 측정된 성과

116종+
객체 자동 감지 분류
온프레미스
콘텐츠 시설 내 보관
MODULESVideo · Speech · Face · Character · Prompter
STTGoogle · Amazon · Naver Clova · Whisper · Daglo
VISION장면 분할 · 객체 116종+ · OCR · 얼굴 인식
SEARCH얼굴 · 객체 · STT · 장면 통합 자연어 검색
DEPLOY온프레미스 · 클라우드 SaaS · 하이브리드

MAIA 도입을 검토 중이신가요?

방송 워크플로우를 알려주시면, 저희 팀이 AI 기술 어떻게 적용할지 함께 설계해 드립니다.