PROXIMA미디어 자산 관리 ZODIAC뉴스룸 TALOS자동 송출 EMOTION라디오 WINNER S오디오 파일 시스템 MAIAAIAI 기술 MYMY콘텐츠 아카이브 G-SAM콘텐츠 배포

MAIA미디어 AI 엔진 · Media AI Agent

방송을 위한 AI 엔진 스위트

MAIA(Media AI Agent)는 영상 · 음성 · 얼굴 · 문자 · 프롬프터를 AI로 분석하는 통합 엔진입니다. 방대한 미디어 라이브러리를 검색 가능한 자산으로 바꿉니다.

온프레미스 배포 — 콘텐츠가 시설 밖으로 나가지 않습니다

MAIA AI 기술 화면

핵심 기능

AI 기술에 필요한 모든 것

MAIA Video — 장면 이해

AI

프레임 → 샷 → 장면 단위로 영상을 분할하고 각 장면의 내용을 텍스트화해 검색 가능한 메타데이터로 저장합니다.

MAIA Speech — 음성 인식(STT)

AI

Google · Amazon · Naver Clova · Whisper 등 다중 STT 엔진과 화자 분리로 모든 발화를 검색 가능한 텍스트로 변환합니다.

MAIA Face — 얼굴 인식

AI

영상 속 인물을 자동 추출 · 군집화하고, 사진 한 장으로 전체 아카이브에서 해당 인물의 모든 등장을 찾습니다.

MAIA Character — 문자 인식(OCR)

AI

자막·하단 자막·CG 등 화면 속 텍스트를 감지해 검색 가능한 형태로 색인합니다.

MAIA Object — 객체 인식

AI

133종의 객체를 감지하여 장면 단위의 영상에 대해 구조화된 메타데이터를 생성합니다.

MAIA Prompter — AI 프롬프터

AI

AI가 진행자의 음성을 실시간으로 스크립트와 매칭해 자동으로 스크롤합니다. 별도 오퍼레이터가 필요 없습니다.

자연어 통합 검색

AI

얼굴 · 객체 · STT · 장면 데이터를 통합하여 일상 언어로 아카이브를 검색합니다.

기능 상세

다섯 개의 엔진, 하나의 MAIA

MAIA Video 장면 인식 화면

장면 인식

Scene Change Detection

AI가 영상을 프레임 → 샷 → 장면 단위로 자동 분할하고, 각 구간을 구조화된 메타데이터로 정리합니다. 온프레미스로 동작해 콘텐츠가 시설 밖으로 나가지 않습니다.

01객체 감지
사람 · 차량 · 동물 · 배경 등 116종 이상을 파놉틱 세그멘테이션으로 분류하고 자동 태깅합니다.
02영상 요약 · 장면 설명
생성형 AI가 장면마다 사람이 읽을 수 있는 설명을 자동으로 작성합니다.
03자연어 검색
얼굴 · 객체 · STT · 장면 데이터를 통합해 일상 언어로 아카이브를 검색합니다.

MAIA Speech 음성 인식 (STT) 화면

음성 인식 (STT)

Speech-to-Text

방송에서 발화된 모든 말이 자동으로, 정확하게, 실시간으로 검색 가능한 텍스트가 됩니다.

01다중 STT 엔진 허브
Google · Amazon Transcribe · Naver Clova · OpenAI Whisper · Daglo를 선택해 적용합니다.
02화자 분리(diarization)
누가 언제 말했는지 타임코드와 함께 식별합니다.
03자막 내 키워드 검색으로 편집 지점을 즉시 찾아가고, AI 자막 편집 · 자동 요약 · 자막 파일 다운로드를 지원합니다.
04클라우드 SaaS(사용량 과금) 또는 Whisper 기반 완전 온프레미스로 배포합니다.

MAIA Face 얼굴 인식 화면

얼굴 인식

Face Recognition

출연자의 모든 등장 장면을 전체 아카이브에서 몇 시간이 아닌 몇 초 만에 찾습니다.

01얼굴 자동 추출
랜드마크 분석으로 얼굴을 감지하고 동일 인물을 자동으로 군집화합니다.
02이미지 기반 검색
사진 한 장을 올리면 일치하는 모든 등장 장면을 즉시 찾습니다.
03인물 타임라인
인물별 등장 구간을 샷 단위 시각 타임라인으로 보여 줍니다.

MAIA Character 문자 인식 (OCR) 화면

문자 인식 (OCR)

OCR Detection

하단 자막, 채널 로고(chyron), 화면 속 그래픽 텍스트까지 자동으로 감지 · 색인 · 검색합니다.

01전체 분석 모드
화면 속 모든 텍스트 영역을 별도 설정 없이 자동으로 감지합니다.
02영역 선택 모드
드래그로 관심 영역을 지정해 원하는 위치만 정밀하게 추출합니다.
03한글 · 영문 · 중국어 · 일본어 등 다국어와 다양한 폰트를 지원합니다.

MAIA Prompter AI 프롬프터 화면

AI 프롬프터

AI-Powered Live Prompting

진행자의 음성을 듣고 스크립트와 실시간으로 맞춰 자동으로 스크롤하는 프롬프터입니다.

01실시간 음성 매칭
진행자의 발화를 분석해 스크립트 위치를 자동으로 따라갑니다.
02오퍼레이터 불필요
전담 운영 인력 없이 완전 자동으로 스크롤합니다.
03온프레미스 · 클라우드(Whisper Live 포함)로 배포합니다.

작동 방식

한 흐름으로 이어지는 워크플로우

01수집→

02AI 분석 (영상 · 음성 · 얼굴 · 문자)→

03메타데이터 · 색인→

04자연어 검색→

05활용 · 재사용

성과 · 사양

검증된 기술, 측정된 성과

116종+

객체 자동 감지 분류

온프레미스

콘텐츠 시설 내 보관

MODULESVideo · Speech · Face · Character · Prompter

STTGoogle · Amazon · Naver Clova · Whisper · Daglo

VISION장면 분할 · 객체 116종+ · OCR · 얼굴 인식

SEARCH얼굴 · 객체 · STT · 장면 통합 자연어 검색

DEPLOY온프레미스 · 클라우드 SaaS · 하이브리드

다른 솔루션

미디어 라이프사이클 전체를 하나로

솔루션 전체 보기 →

미디어 자산 관리

수집에서 배포까지, 미디어 자산의 전 과정

자세히 보기 →ZODIAC

뉴스룸

기획에서 송출까지, 하나의 뉴스룸

자세히 보기 →TALOS

자동 송출

멈추지 않는 자동 송출

자세히 보기 →EMOTION

라디오

하드웨어에 종속되지 않는 라디오

자세히 보기 →WINNER S

오디오 파일 시스템

디지털 환경 최적화 오디오 파일 시스템

자세히 보기 →MYMY

콘텐츠 아카이브

필요한 순간, 바로 찾는 콘텐츠

자세히 보기 →G-SAM

콘텐츠 배포

하나의 콘텐츠를 모든 채널로

자세히 보기 →

MAIA 도입을 검토 중이신가요?

방송 워크플로우를 알려주시면, 저희 팀이 AI 기술을 어떻게 적용할지 함께 설계해 드립니다.