디지털 시대의 발전과 함께 인공지능 기술을 활용해 디지털 취약 계층의 문제를 해결하려는 노력이 이어지고 있습니다. 제가 직접 참여한 K디지털 플랫폼 AI 경진대회에서 보이스피싱을 감지하는 보이스캐너 프로젝트를 통해 인공지능의 가능성을 확인해 본 경험을 나누고자 해요. 대회 주제는 인공지능을 활용하여 디지털 확산을 촉진하고 디지털 취약 계층의 문제를 해결하는 목표로 설정되었답니다. 아래를 읽어보시면 제가 경험한 내용을 통해 프로젝트의 전반적인 과정을 자세히 알 수 있을 거에요.
보이스캐너의 개요와 필요성
보이스캐너라는 이름은 보이스(Voice)와 스캐너(Scanner)의 합성어로, 전화 통화 중 상대방의 목소리를 실시간으로 분석하여 보이스피싱인지 여부를 구분하는 어플리케이션입니다. 그리고 의심상황이 발생했을 때는 사용자에게 즉시 경고 메시지를 보내는 시스템이에요.
보이스캐너 프로젝트 착상 계기
제가 보이스캐너를 생각하게 된 계기는 친구와 대화 중에 발생한 특정 상황에서 비롯되었어요. 친구가 수상한 전화를 받고 혼자서 움직이려고 했을 때, 제가 들여다보니 보이스피싱으로 의심되는 상황이었답니다. 이 과정을 지켜보며 만약 친구 혼자였더라면 어땠을까 하는 의문이 떠올랐어요. 보이스피싱의 수법에 대한 정보는 청년층이 상대적으로 많이 접하지만, 노년층은 정보 접근이 제한적이죠. 그래서 보이스피싱에 대한 조언을 제공해줄 수 있는 앱이 필요하다고 느꼈어요.
보이스캐너의 기대 기술 구현
- 통화 중 보이스피싱 대화를 감지
- 사용자에게 안내 메시지와 대응 방법 전송
- 보호자에게 대화 내용 텍스트로 전송
- 금융 어플리케이션 잠금 기능
- 즉각적인 전화번호 신고 기능 제공
- 현재 통화 내용에 대한 챗봇 서비스 제공
- 3차 경고 후 통화 지속 시 보호자에게 통화상황 공유
- 경찰 및 은행, 보안 기업과의 협업을 통해 안전성 및 데이터셋 업데이트
이를 통해 보이스캐너는 사용자가 불안하지 않게 보호받을 수 있도록 하는 기능을 제공해요. 이는 디지털 취약 계층을 보호하는 중요한 역할을 수행하게 될 것입니다.
데이터 분석 및 모델 생성 과정
데이터 분석 및 모델 생성을 위해 여러 방법을 사용했어요. 직접 경험해본 바에 따르면, 데이터 수집은 매우 중요한 단계입니다.
데이터 수집 전략
- 금융감독원 홈페이지를 통해
그놈목소리자료를 크롤링하여 보이스피싱 음성 데이터를 확보하였습니다. - 한국인 대화 음성 데이터는 AI Hub에서 활용했답니다.
모델 생성 과정
모델 생성은 여러 과정을 통해 이루어졌어요. 다음과 같은 단계를 따라 진행했습니다.
- 보이스피싱 음성 데이터를 텍스트로 변환
- 코랩의 환경에서 Python의 requests 라이브러리를 사용
konlpy를 활용하여 텍스트 데이터를 전처리
여기에서 중요한 것은 데이터 전처리 과정인데, 이 과정에서 음성 데이터에서의 명사를 추출하여 데이터 프레임으로 만들었어요. 다음은 자료 처리 과정을 시각적으로 정리한 표에요.
| 단계 | 설명 |
|---|---|
| 데이터 변환 | 음성 데이터를 텍스트로 변환 |
| HTTP 요청 전송 | Python requests 라이브러리 사용 |
| 텍스트 전처리 | konlpy와 Pandas를 통해 데이터 준비 |
| 모델 학습 | RandomForest 및 Lasso 모델 적용 |
모델은 RandomForest와 Lasso를 사용하며, 두 모델이 과적합되는 문제를 겪었어요. 그 이유는 보이스피싱 데이터와 일반 대화 데이터의 수가 적었고 한국어 텍스트 분석에 최적화된 kobert 모델을 사용하지 않았기 때문이라고 분석했어요.
시연 및 결과
프로젝트 진행 과정에서 실제 적용 가능성을 증명하기 위해 시연도 진행했어요. 시연을 통해 보이스캐너의 기능을 직접 체험해보았답니다.
시연 과정
시연 과정에서 몇 가지 기능을 중점적으로 보여주었어요. 예를 들면, 의심스러운 통화를 식별하여 즉각적으로 경고 메시지를 전송하는 프로세스를 보여주었답니다. 또한, 보호자에게 통화 내용이 전송되는 모습도 시연했어요.
결과와 피드백
프로젝트 공식 발표 후 받은 피드백은 정말 큰 도움이 되었어요. 여러 참가자들이 제안하는 개선점을 통해 좀 더 발전된 아이디어를 갖게 되었답니다. 특히 챗봇 서비스와 관련한 의견이 많았어요.
향후 계획
이 프로젝트를 통해 여러 기능들을 구현하고 앞으로도 보완할 부분이 많아요.
- 챗봇 기능 추가
- 금융 어플리케이션 잠금 기능 개선
- 보호자에게 전화음성을 텍스트로 변환 제공
이처럼 보이스캐너 프로젝트는 실질적인 애플리케이션으로 발전할 가능성을 가지고 있습니다. 제가 동료와 함께 하며 느꼈던 개발의 기쁨은 큰 자산이 되었어요.
자주 묻는 질문 (FAQ)
보이스캐너는 어떻게 작동하나요?
보이스캐너는 통화 중 음성을 분석하여 보이스피싱 징후를 감지하는 어플리케이션입니다.
보이스피싱에 대해 어떻게 판단하나요?
보이스캐너는 설정된 알고리즘을 통해 대화 패턴을 분석하여 의심스러운 부분을 찾아냅니다.
보이스캐너의 추가 기능은 무엇인가요?
재무정보를 보호하기 위한 잠금기능과 보호자에게 상황을 전달하는 기능이 포함되어 있습니다.
이 프로젝트의 차별점은 무엇인가요?
사용자의 안전을 최우선으로 하여 금융 어플과 통합된 형태로 보이스피싱 방지 솔루션을 제공한다는 것이죠.
전반적으로 보이스캐너 프로젝트는 향후 디지털 사회에서 더 많은 기여를 할 수 있는 가능성을 지니고 있어요. 다양한 시나리오와 기능을 통해 사용자의 안전성을 극대화하고, 나아가 보이스피싱 문제를 해결하는데 일조할 수 있을 것입니다.
키워드: 보이스캐너, 보이스피싱, 인공지능, 디지털 플랫폼, 경진대회, 데이터 분석, 챗봇, 음성 인식, 금융 안전, 모델 생성, 프로젝트 리뷰