jun-wiki

View My GitHub Profile

Posts (Latest 10 updated) :
Read all
Contents:
  1. ai 공부
    1. 저차원 표현
  2. 준비
    1. 업로드
    2. stt
    3. tts
    4. 다운로드

ai 공부

저차원 표현

데이터를 압축하고 추상화해서 표현하는 걸 의미한다

잠재 공간이라는 주요개념을 알아야하는데 이는 우리가 볼 수는 없지만 원래 데이터의 주요 패턴이나 구조를 잘담고 있는 숨겨진 특징을 의미한다

256x256의 이미지는 128x128로 압축해도 이미지의 원 의미는 유지되기에 이처럼 압축된 벡터를 저차원 표현이라고 한다

준비

그 뭐냐 코치진과 나만무 기획 발표 준비

업로드

오디오 추출, 노이즈 제거, 스트리밍 디코딩

stt

번역시 원본의 문맥 파악해서 사용할 사전을 참조하거나 단어 추천을 통해 성능향상

번역

번역본 + 원본 비교 (유저로 하여금 길이 및 원하는 대사? 커스텀)

언어간 문장길이 차이 해결

의태어, 의성어의 경우 사전(번역사/번역가들의 데이터) 참조

없는단어 개선

주요: 번역사가 해야할 일 대체해야함

에디터 + 번역 맞춰야 함 (길이, 언어에 한정된 단어)

  • 번역본 대사 버전 변형

  • 여러명 에디팅 혹은 파일들 병합시 충돌 등 해결?

tts

보이스 클로닝으로 억양 확실히 사용되는지 확인 필요

에디터 + 원본 사운드와 번역본 사운드 싱크 맞추기

  • 업데이트된 번역본 TTS로 재더빙

다운로드

오디오트랙, 자막 트랙 cdn과 연계

요약: 유저 시나리오 고민 더 해라

  • 시연을 위한 능동적 행동

개인 생각: 영상 하나에 에디터 편집 포인트 2~3개 추정 이후 에디터에서 그대로 export혹은 다음 단계 선택 기능