Intelligens mobil alkalmazás - Clipboard felolvasó

OData támogatás
Konzulens:
Dr. Gyires-Tóth Bálint Pál
Távközlési és Médiainformatikai Tanszék

최근, 스마트폰은 널리 사용되고 발달하게 있는 중이다. 스마트폰의 인터페이스는 키보드를 기반으로 한 인터페이스에서부터 최근 그래픽 유저 인터페이스로 발전되어 왔다. 그래픽 유저 인터베이스는 많은 장점을 가지고 있는 인터베이스이다. 이것은 일반인들이 사용하기에 매우 쉽다 왜냐하면 인터페이스 자체가 매우 직관적이기 때문이다. 특히, 이 인터페이스는 키보다 없는 스마트폰에 매우 유용하다. 하지만 많은 장점에도 불구하고 그래픽 유저 인터페이스는 핸드폰 스크린을 터치하는데 어려움이 있거나 시력이 좋지 않은 사람들에게는 유용하지 못하다. 이 부족함을 채우기 위해 스피치 유저 인터페이스가 개발되어 새롭게 인기를 얻고 있고, 스피치 유저 인터페이스를 기반으로 한 다양한 기술 또한 개발되고 있다. 인간의 언어에 해당하는 소리를 내기 위해서 Text-To-Speech (TTS) 라는 기술이 사용된다. 이 기술을 이용하여 시각이 불편한 사람과 손을 쓰는데 불편함이 있는 사람들을 도와줄 수 있다. 더불어 이 기술은 응급한 상황에서도 사용될 수 있다. 예를 들면, 긴급한 상황 속에 있는 사람들은 자신이 처한 상황을 알리기 위해서는 차분하고 분명한 목소리가 필요한데, 이 기술은 그러한 목소리를 제공할 수 있다.

나의 논문의 목적은 이 기술을 이용하여 클립보드에 들어있는 문자를 읽는 어플리케이션을 만드는 것이다. 어플리케이션에는 여러 가지 특징이 있다. 첫째, 다양한 언어를 제공한다. 현재는 헝가리어와 영어를 지원하고 있다. 사용자는 세팅 메뉴를 이용하여 언어를 바꿀 수 있다. 둘째, 흔들기 모드를 제공한다. 즉, 사용자가 흔들기 모드로 세팅한 후, 스마트폰을 흔들면 어플리케이션은 그 동안 읽어온 문자를 저장해 온 리스트의 마지막 문자를 읽는다. 셋째, 어플리케이션은 백그라운드 서비스로서 작동하기 때문에 긴 문자를 읽는 것이 가능하다. 음악 재생 어플리케이션처럼 글을 읽는 소리를 들으면서 다른 어플리케이션을 이용할 수 있다. 넷째, 사용자가 읽은 텍스트 데이터를 저장할 수 있는 기능이 있다. 사용자는 자신이 어떠한 텍스를 읽었는지 확인할 수 있고, 다시 들을 수 있다. 다섯 째, 사용자는 세팅 메뉴를 이용하여 사용자 유저 인터페이스를 자신의 기호에 맞게 바꿀 수 있다. 사용자는 반복 회수와 폰트 사이즈를 정할 수 있고 앞에서 언급했듯이 언어 또한 바꿀 수 있다. 그리고 배경 색깔과 글자 색을 짝으로 바꿀 수 있다. 흔들기 모드를 사용 유무 또한 정할 수 있다. 여섯 째, 사용자가 클리보드로 복사한 글자 무슨 언어로 이루어져 있는 지 알려준다. 현재는 영어와 헝가리어가 구분 가능하다.

챕터 1에는 안드로이드에 대한 기분적인 정보를 알려준다. 거기에 더불어, TTS의 작동 원리와 이것이 사용되는 분야가 소개되어 있다. 챕터 2에서는 “Unit Selection” 과 “statistical parametric speech synthesis” 가 설명 되어 있어 있는데 왜냐하면 이 두 기술은 소리를 합성하기 위한 가장 기보적인 기술이기 때문이다. 따라서 TTS의 가장 핵심적인 부분이다. 챕터 3에서는 TTS 기술을 사용한 어플리케이션을 설명한다. 챕터 4에서는 어플리케이션의 전체적인 작동원리를 코드와 함께 설명하였다. 챕터 5에서는 일반 스마트폰 사용사가 어플리케이션을 사용하고 난 후의 평가가 기술되어 있다. 마지막 챕터에서는 논문을 통해서 얻은 점과 TTS의 중요성, 그리고 발전 가능성에 대해서 언급하였다.

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.