개발 diary/영상
유튜브, 영상 자동화 개발 실패기
자무카
2025. 5. 16. 18:51
그 동안은 여행업 관련된 것이나 erp 개발에만 관심이 많았다.
주로 입력형 erp 다 보니 주 요구사항은..
CRUD 와 DB 설계.
복잡하고, 편리한 CRUD 가 중요하니, frontend 기술이 중요했고, frontend 는.... ㅠㅠ 적성에 정말 안맞는데... 그러다보니, 한숨만 팍팍 무한반복. 난 기획, 설계가 적성인데 말이다.
IT 는 AI 응용 개발이 대세인데, 주로 지금까지 손대기 어려웠던 영상, 음성 같은 분야. 좁혀서 말하면 유튜브 컨텐츠 제작 자동화 인거다.
마침내 이 쪽을 하나씩 공부하면서, 손대기로 했다.
몇 몇 허접한 유튜브 오픈소스 앱 발견 - 지옥...
요즘에 유튜브 자동화가 워낙 많아서, 간단히 손대봐야지 라는 생각.
그것은 지옥...
아이디어
- 썸네일만 클릭해서 스크립트 입력 -> TTS
대부분 이 정도 80% 자동화를 하는 것 같았다. - 이걸 쉽게 생각하고, 계속된 실패에 프로세스를 계속 나누다 보니, 와 이게 보통 일이 아니었어.
소위 생성형 AI 였던게야...
- 영상 편집... AI 하면 파이썬을 빠져나갈 수 없다.
- 처음엔 아주 가볍게 하루면 만들줄 알았어. ㅠㅠ m1 mac 에서 tkinter 호환성 오류 파팍.
- 나 혼자 쓸건데, cli 면 어떠냐... 하....답답
- 나 혼자 쓸거니 간단하게 웹으로 써야겠어 flask 로... 웬걸. ㅠㅠ
- 간단한거 뭐 없나? streamlit, Gradio 발견. 하............ 개쉑들. 온통 버그, 모듈 충돌... 아후...
- fastapi 는 써야겠고, 썸네일이나 진행상황 및 폼입력 생각하니, 결국 front 도 엄청 커지고.
- 특정 인기 커뮤니티에서 인기 글을 랜덤 추출.
- 와.... 이게.... 이게.... 크롤링. 단순 크롤링도 아니고, 베스트글, 주제 폼을 입력받고, 일부 댓글 인증용 캡처까지. 하...
- 만약 외국 사이트라면, 번역 api 사용.
- AI 로 스크립트를 만든다.
- 프롬프트를 사용하고, 데이터 전처리, 후처리 필요. yaml, json, sqlite 등 전체 데이터 포맷과 형식 고민 필요. json이 가장 무난.
- 스크립트로 tts api 를 이용한다. 필요할시, 번역 api 까지.
- 동시 작업을 위해, 병렬 처리 진행. - 이미지와 영상을 모은다.
- 생성형 ai 를 제공하는 api 를 이용. ( 각각의 서비스 특징과 api 등 콸리티 및 특징 비교 분석)
- 무료 자료를 제공하는 api 를 찾거나, 없을시 처리.
- 요즘 유행하는 음성과 자막 일치.
- ass 변환, puppeter , 스크립트 -> mp3 -> OpenAI 의 whisper 모듈을 이용해서, 단어별로 쪼개서 타임코드와 저장.
- 템플릿이나 원하는 목적에 따라 후처리. 문장 단위 등
- 렌더링
- 무비파이로 썸네일을 만든다.
- 이 과정에서 그지같은 무비파이 모듈간 버전 오류는 마구 쏟아진다. 한글 폰트 오류 등등.
- 최종 데이터 템플릿을 이용해서, ffmpeg 으로 렌더링
- 무비파이로 썸네일을 만든다.
- 이 과정이 오류없이 잘 될까? 그리고, 어느 정도 폼이나 사용성 등을 생각하면...
아무리 ai 도움으로 코딩이 빨라졌다 하지만, 너무 멍청한 짓이였어. 하............애초에 안되는 거였어.
여러명 붙어서 잘 작업했다면, 좀 빨라질 수도 있겠다만... 결국 다 마음에 안들어서 폐기 중단했지만,
추후 모듈 단위로 분리해서 작업하고, 요즘 여러 ai 툴들을 병렬적으로 활용하면서, 자동화하면 ....
이론적으로는 가능하겠다. 요즘 ai 의 속도로 보면, 이런 것 조차 금방 만들어질거다. 그게 내일일지, 모레일지.
복잡한 개발은 하지말아야 한다. 생각만으로 2-3시간만에 만들 수 있는 서비스를 만들어야해.
api 활용, 전통적 crud 앱.
근데, 이런건 이미 다 넘쳐나잔아. 뷁!!!!!
개발은 먹고 살게 없는 세상이 급속도로 다가온다는.... 단가 팍팍 떨어지는 세상.