파란학기제

Leitmotif: 키워드 기반 관련주 및 테마주 검색 서비스

작품개요

본 제품은 키워드 기반 연관 주식 종목 및 문서 검색 서비스입니다.


먼저, 정의가 필요한 용어들은 “키워드”, “연관”, “검색” 그리고 “문서”입니다. 본 서비스에서 정의한 “키워드”란 먼저 한개 이상의 명사나, 두 단어 이상이 한 가지의 개념을 가리킬 때의 단어 뭉치를 말합니다. 가령, 단일 단어의 경우는 치매, 음성인식과 같이 일반명사가 있고, 안철수, 이재명과 같이 유명인의 이름이 될 수 있으며, 쿠팡, 삼성전자와 같이 회사의 이름이 될 수도 있습니다. 여러 단어의 경우에는 “플렉서블 디스플레이”와 같이 두 단어가 함께 있어야 자체가 특정 개념을 가리킬 때 키워드가 될 수 있으며, “황사 미세먼지”나 “메르스 코로나” 처럼 두 단어 이상의 조합이 어떤 특정 개념을 가리키지는 않지만, 어떤 상위의 개념 아래에 있을 때 키워드라고 할 수 있습니다.


다음으로는 “연관”입니다. 관련주에서 말하는 키워드와 주식 종목 간의 연관성은 네 가지 분류가 있습니다. 첫 번째는 상장사가 키워드의 개념을 통하여 직접적인 매출을 내고 있거나 경제적인 이득을 취하고 있을 때의 연관성을 말합니다. 가령, “코로나”라는 키워드와 코로나 진단 키트를 판매하여 매출을 내고 있는 SD 바이오센서는 서로 연관이 있다고 할 수 있습니다. 이 때 관련 키워드를 통하여 DART 전자 공시에서 확인할 수 있는 분기 보고서의 제품이나 비전에 명시되어 있는 단어일 경우나, 투자를 하고 있는 사람들이 종목이 키워드로 경제적인 이득을 보고 있다는 것에 동의하는 비율이 유의한 수준을 넘길 경우에만 경제적인 이득을 내고 있다는 판단을 할 수 있습니다. 두 번째는 매출과는 상관성이 낮지만, 사회적인 이슈를 통하여 연관이 있다고 판단할 수 있는 경우의 연관성을 말합니다. 가령, 안철수와 안랩은 직접적인 매출의 연관관계는 없지만, 창업자임을 고려했을 때 연관성이 있다고 판단할 수 있습니다. 이에 대한 판단의 근거는 뉴스나 텔레그램과 같이 사회적인 정보를 담은 문서에서 함께 등장한 적이 있는 경우 사회적으로 관련이 있다고 할 수 있겠습니다. 세 번째는, 사회적인 이슈로도 연관성이 낮지만, 상장사가 매출을 내는 방식과 연관성이 높은 키워드의 경우 연관성이 있다고 판단할 수 있습니다. 예를 들자면, 여름 관련주에는 빙과류 업체, 냉방기 제조업체들이 해당하는데, 여름을 통하여 돈을 번다고 할 수는 없지만, 여름과 매출을 내는 방식과 의미적인 상관도가 높기 때문에 연관성이 있다고 할 수 있습니다. 마지막으로는 가장 중요하다고 할 수 있는 요소인데, 일반 투자자들로 하여금 관련주 테마주로 투자를 하게 하여 그 과정에서 이득을 얻는 배후세력들이 관련주 찌라시를 퍼뜨리는 경우가 많다고 합니다. 이를 대비하기 위하여 온라인 상에서 이미 키워드와 종목 간 연관도가 높다고 나온 분석결과가 하나라도 있는 경우 이를 연관성이 높다고 봅니다.


그리고, 본 제품에서의 “검색”은 키워드를 검색하였을 때 세 가지 결과가 나오는 것을 말합니다. 첫 번째는 키워드와 연관된 주식 종목을 랭킹으로 나열한 결과입니다. 이 때 랭킹은 연관성이 높은 순서대로 여러 결과를 뽑은 후 거래량과 주가 추이의 움직임이 유사한 정도로 움직인 종목들이 보이게 필터링하여 나열하는 것을 말합니다. 두 번째는 연관된 주식 종목에 대한 판단의 근거에 해당하는 출처 문서를 말합니다. 세 번째는 연관성이 높은 문서들을 나열한 결과를 말합니다. 


마지막으로 “문서”란 본 제품을 만드는 데에 수집된 모든 텍스트 데이터 덩어리를 말합니다. 가령, 텔레그램 대화 내용, 뉴스 본문, 공시 보고서, 분석 리포트가 해당이 될 수 있습니다.


최종 성과 발표회

중간교류회

등록자

지도교수

SNS바로가기

인스타그램

유튜브

블로그

페이스북

Like it0