말하면 바로 글이 된다 – macOS 로컬 음성인식 앱 'Ghost Pepper' 완전 정복
회의록 작성하다가 손목이 아프셨던 적 있으신가요? 강의를 들으면서 타이핑하느라 내용을 놓쳐본 경험은요? 저도 그랬습니다. 음성 인식 도구를 찾아봤더니 대부분 클라우드 기반이라 인터넷이 없으면 무용지물이고, 녹음 파일이 서버로 올라간다는 사실이 영 찜찜했습니다. 그러다 우연히 발견한 게 바로 Ghost Pepper입니다. 이걸 처음 써봤을 때 혼자 중얼거렸습니다. "이게 무료라고?"
Ghost Pepper가 뭔가요?
Ghost Pepper는 macOS 전용 로컬 음성-텍스트 변환(STT) 앱입니다. OpenAI가 오픈소스로 공개한 Whisper 모델을 기반으로 만들어졌는데, 핵심은 모든 처리가 내 맥북 안에서 끝난다는 점입니다. 인터넷 연결이 전혀 필요 없습니다. 녹음 파일이 서버로 전송되지 않습니다. 민감한 회의 내용이나 개인 메모도 안심하고 받아쓸 수 있습니다.
출시되자마자 해외 개발자 커뮤니티에서 빠르게 입소문이 났습니다. Hacker News, Reddit 등에서 "드디어 제대로 된 macOS 로컬 STT 앱이 나왔다"는 반응이 쏟아졌고, 오픈소스 생산성 도구 커뮤니티에서도 주목받고 있습니다.
핵심 기능 3가지 – 이래서 다릅니다
첫째, 완전 로컬 처리. 가장 중요한 특징입니다. Ghost Pepper는 Whisper 모델을 로컬에서 직접 실행합니다. 인터넷이 끊긴 비행기 안에서도, 보안이 엄격한 사내 망에서도 그대로 작동합니다. 클라우드 STT 서비스들이 으레 요구하는 API 키도, 월정액 구독료도 없습니다. 한 번 설치하면 끝입니다.
둘째, 메뉴바 상주 방식으로 언제든 즉시 실행. Ghost Pepper는 맥 상단 메뉴바에 조용히 자리잡습니다. 아이콘 클릭 한 번 또는 단축키 하나로 즉시 받아쓰기를 시작할 수 있습니다. 별도 창을 띄우거나 앱 전환을 할 필요가 없어서, 작업 흐름이 전혀 끊기지 않습니다. 구글 독스에 글을 쓰다가도, 슬랙 메시지를 입력하다가도, 노션 페이지를 채우다가도 그냥 말하면 됩니다.
셋째, 다국어 지원 및 한국어 인식 가능. Whisper 모델 자체가 99개 언어를 지원하기 때문에 Ghost Pepper도 한국어를 인식합니다. 완벽하지는 않지만, 또렷하게 말하면 인식률이 상당히 준수합니다. 영어는 특히 정확도가 높아서, 영어로 말하고 싶은 분들께는 거의 불편함이 없는 수준입니다.
설치 방법 – 5분이면 끝납니다
Ghost Pepper는 GitHub에서 무료로 내려받을 수 있습니다. 설치 과정은 다음과 같습니다.
1단계: GitHub 저장소에서 최신 릴리즈의 `.dmg` 파일을 다운로드합니다.
2단계: DMG를 열고 Ghost Pepper 앱을 응용 프로그램 폴더로 드래그합니다.
3단계: 처음 실행 시 macOS 게이트키퍼 경고가 뜰 수 있습니다. 시스템 설정 → 개인 정보 보호 및 보안에서 "확인 없이 열기"를 선택하면 됩니다. (오픈소스 앱이라 Apple 공증이 없어서 나오는 경고입니다.)
4단계: 최초 실행 시 사용할 Whisper 모델을 선택합니다. tiny나 base 모델은 용량이 작고 빠르지만 정확도가 낮고, small이나 medium은 더 정확하지만 모델 다운로드에 시간이 걸립니다. 처음이라면 small 모델을 추천합니다. 속도와 정확도의 균형이 좋습니다.
5단계: 마이크 접근 권한을 허용하면 준비 완료입니다.
메뉴바에 고추 모양 아이콘이 생겼다면 성공입니다. 이제 단축키를 누르고 말하면 커서가 있는 자리에 텍스트가 바로 입력됩니다.
실제로 이렇게 씁니다 – 활용 예시 5가지
설치만 해두고 안 쓰면 의미가 없겠죠. 제가 실제로 활용하는 방식과, 다른 사용자들이 공유한 활용 사례를 소개합니다.
① 회의록 실시간 작성. 회의 중에 Ghost Pepper를 켜두고 말하는 내용을 받아쓰면, 회의가 끝날 때쯤 초안이 완성되어 있습니다. 이후 GPT나 Claude로 정리만 하면 깔끔한 회의록이 됩니다. 회의 내용이 외부 서버로 유출될 걱정이 없으니 보안상 민감한 내용도 안심입니다.
② 아이디어 메모. 뭔가 떠올랐을 때 타이핑보다 말이 더 빠릅니다. 노션이나 메모 앱을 열고 단축키 누른 뒤 생각을 쏟아내면 됩니다. 생각의 흐름이 끊기지 않아서 브레인스토밍에 특히 효과적입니다.
③ 이메일·슬랙 메시지 초안. 긴 이메일을 쓸 때 말로 초안을 만들고, 이후 텍스트를 다듬는 방식으로 쓰면 작성 시간이 절반으로 줄어듭니다. 손목 건강에도 좋습니다.
④ 유튜브·팟캐스트 스크립트 작성. 대본 없이 즉흥으로 말한 내용을 받아써서 스크립트로 가공하는 방식입니다. 특히 1인 크리에이터들 사이에서 인기 있는 활용법입니다.
⑤ 영어 공부. 영어로 말한 내용이 얼마나 정확하게 인식되는지 확인하면서 발음 교정에 활용하는 분들도 있습니다.
비슷한 대안과 비교해보면
Ghost Pepper 말고도 음성-텍스트 변환 도구는 여러 개 있습니다. 어떤 차이가 있는지 정리해봤습니다.
Apple 받아쓰기 (내장 기능): macOS에 기본으로 포함되어 있어 가장 접근성이 좋습니다. 하지만 클라우드 처리 방식이라 인터넷이 필요하고, 긴 문장에서는 인식률이 떨어질 수 있습니다. 오프라인 모드도 있지만 정확도 차이가 납니다.
Whisper Transcription (유료, App Store): 마찬가지로 Whisper 기반이지만 유료입니다. UI가 더 세련되고 배치 처리 기능이 있지만, 단순 실시간 받아쓰기 용도라면 Ghost Pepper로 충분합니다.
Superwhisper: 비슷한 콘셉트의 경쟁 앱입니다. 기능이 더 많고 UI도 polish가 높지만, 유료 구독 모델입니다. 정말 헤비하게 쓸 계획이라면 고려할 만하지만, 가볍게 시작하고 싶다면 Ghost Pepper가 훨씬 합리적입니다.
Otter.ai, Rev 등 클라우드 서비스: 팀 협업이나 자동 회의 요약이 필요하다면 이쪽이 낫습니다. 하지만 개인 사용 기준으로는 무료 플랜 제한이 있고, 데이터가 외부 서버로 전송됩니다.
결론적으로 Ghost Pepper는 "무료 + 로컬 처리 + macOS 메뉴바 통합" 이 세 가지를 동시에 원하는 분들께 최적입니다. 이 조합을 제공하는 무료 앱은 사실상 Ghost Pepper가 유일합니다.
한 가지 솔직하게 말씀드리면, 한국어 인식은 영어보다 정확도가 낮습니다. 빠르게 말하거나 사투리가 섞이면 오인식이 생깁니다. 그래도 천천히 또렷하게 말하면 충분히 실용적인 수준이고, 영어 사용자라면 불편함이 거의 없습니다. 한국어 인식을 개선하고 싶다면 medium 이상의 모델을 사용하는 것이 효과적입니다.
클라우드에 내 목소리를 보내고 싶지 않으신 분, 비행기 안에서도 받아쓰기를 하고 싶으신 분, 그리고 그냥 월정액이 싫으신 분. Ghost Pepper는 그 모든 조건을 한 번에 해결해줍니다. 한번 설치해보시면 왜 이 앱이 화제가 됐는지 바로 느끼실 겁니다.
댓글