• 제목/요약/키워드: 관심사 추출

검색결과 108건 처리시간 0.024초

기술로드맵핑을 위한 특허정보의 SAO기반 텍스트 마이닝 접근 방법 (An SAO-based Text Mining Approach for Technology Roadmapping Using Patent Information)

  • 최성철;김홍빈;윤장혁
    • 기술혁신연구
    • /
    • 제20권1호
    • /
    • pp.199-234
    • /
    • 2012
  • 기술로드맵 (Technology RoadMap: TRM)은 전략적 기술기획 및 관리를 위한 필수적인 도구이다. 최근 급속한 기술변화와 시장경쟁의 심화로 인해 TRM은 점차 중요시되고 있는데, 이는 TRM이 기업의 전략적 목적과 기술을 연계함으로써 장기적으로 필요한 기술들을 확보하기 위한 일종의 지도 역할을 하기 때문이다. 그러나 TRM을 개발하고 유지하기 위해서는 기술 전문가의 정성적 노력에 따른 많은 비용과 시간이 수반됨으로 인해, 기술문서의 자동화된 분석을 통해 TRM 개발 생산성을 높이는 방법에 대한 연구가 기업과 정부기관들의 최근 주요 관심사 중의 하나이다. 비록 TRM 개발을 위해 키워드 기반의 접근방법 (Keyword-based Patent Analysis)이 제시된 바 있으나, 이 방법은 미리 정의된 키워드의 출현정보에만 기반하므로 기술요소들간의 명시적 연관관계를 담지 못한다. 즉, 키워드 기반의 접근은 기술의 목적, 구성, 효과 (Objective, Structure, Effect: OSE)에 대한 정보를 제공하지 못하기 때문에 기술로드맵핑 시 기술정보의 활용성 측면에서 한계점을 지닌다. 이에, 본 연구는 기능 (Function) 기반의 접근법을 활용한 기술로드맵핑 방법을 제시한다. 기능이란 기술의 OSE 정보를 담고 있으며 Subject-Action-Object (SAO) 구조로 표현될 수 있기 때문에, 본 연구에서 제시되는 방법은 기술문서의 자연어처리분석을 통해 기술의 OSE 정보를 추출하여 TRM을 개발할 수 있도록 한다. 본 연구의 방법을 연구개발 기획단계에 적용함으로써, TRM 개발에 따른 비용과 시간의 절감이 가능하며, 제품이나 기술 OSE에 대한 연구개발 기획전문가의 시야를 넓혀 보다 효과적인 의사결정이 가능할 것으로 기대된다.

  • PDF

조선소 근로자들의 구강보건교육경험 유무에 따른 구강보건인식의 차이 (Relationship of Oral Health Education Experience to Oral Health Awareness among Shipbuilding Workers)

  • 김은주;우승희
    • 한국콘텐츠학회논문지
    • /
    • 제12권7호
    • /
    • pp.240-246
    • /
    • 2012
  • 작업공정 특성상 작업환경이 열악하다고 판단되는 조선소 근로자의 구강보건증진과 구강보건교육계획, 산업구강보건정책 및 제도 개선에 기여하고자 편의표본추출법에 의해 선정한 전남 지역 조선소 및 협력업체 10곳에 근무하는 조선소 근로자를 대상으로 구강보건교육 경험에 따른 구강보건인식의 차이를 알아보기 위하여 조사한 결과는 다음과 같다. 연구대상자 310명 중 구강보건교육경험이 없는 근로자는 89.4%이었고, 구강보건교육 무경험자는 구강보건 지식정도, 인식정도, 관심정도, 중요정도가 낮은 것으로 나타났으며 구강보건 지식정도, 인식정도, 관심정도, 중요정도 간에는 상관관계가 높은 것으로 나타났다. 구강보건교육 무경험자가 구강보건교육을 받지 못하는 이유는 기회가 없었기 때문인 것으로 나타났고 선호하는 교육내용은 치아우식증예방 및 치료법, 선호하는 교육방법은 치의사의 강연인 것으로 나타났으며 구강보건교육 경험이 있는 근로자일수록 구강보건교육 경험이 없는 근로자보다 구강보건교육에 참여할 의향이 있는 것으로 나타났다.

모바일 커머스의 성공 요인들에 관한 연구 : 가치 중심적인 분석 (Mobile Commerce Success Factors: A Value-Focused Analysis)

  • 이정우;이승희
    • 한국전자거래학회지
    • /
    • 제8권4호
    • /
    • pp.129-149
    • /
    • 2003
  • 최근 모바일 핸드셋을 포함한 모바일 서비스의 보급률이 향상되고, 소비자들의 다양한 욕구를 충족시키기 위한 모바일 데이터 서비스들이 우리의 생활 전반에 급격히 확산되고 있다. 이러한 모바일 커머스의 환경에서 기업은 효과적 인 상품 개발과 서비스를 위해 사용자들이 모바일 커머스에서 중요하게 고려하는 가치가 무엇인지를 파악할 필요가 있다. 모바일 커머스에 관한 연구들이 활성화 되어가고는 있지만 아직까지 사용자 관점에서 접근한 모바일 커머스의 가치에 대하여 학술적으로 합의된 분석 프레임웍은 없는 것으로 보이며 기존의 연구들은 기술 중심적인 연구에 치중되어 있거나 모바일 커머스에 적합하지 않을 수 있는 기존의 프레임웍을 적용하여 실증하기 위한 연구들이 주류를 이루고 있다. 본 연구에서는 Keeney의 가치 중심적인 사고(Value-focused thinking) 기법을 활용하여 70명의 모바일 커머스 사용자들에게 모바일 커머스 사용의 장단점에 대하여 인터뷰를 실시하였고 그 결과 738개의 문장을 수집하여 중복되는 내용을 제거하고 182개의 일반 형태를 추출하여 이를 다시 그룹화 하여 11개의 근본적인 목표들(fundamental objectives)과 18개의 중간 수단의 목표들(means objectives)로 분류하여, 최종 목표의 가치와 그것을 달성하는 데 필요한 수단 목표 가치를 체계화하여 수단-최종 목표 네트워크(means-ends network)를 도출하였다. 이러한 사용자의 관점에서 접근한 모바일 커머스의 가치 프레임웍은 학문적으로 뿐 아니라 실무에서도 유용한 구성 개념으로 고객이 기꺼이 지불할 의사가 있는 모바일 커머스 서비스의 관심사로서 향후 기업이 모바일 비즈니스에 추구할 수 있는 모바일 커머스의 기술 및 서비스 상품개발과 설계에 도움이 될 것이다.

  • PDF

빅 데이터 분석을 통한 해외건설 빅 이슈 개발 (Development of Overseas Construction Big Issues based on Analysis of Big Data)

  • 박환표;한재구
    • 한국건설관리학회논문집
    • /
    • 제19권3호
    • /
    • pp.89-96
    • /
    • 2018
  • 본 연구는 빅 데이터 분석을 통한 해외건설 빅 이슈를 도출하였다. 해외건설 Big 이슈 도출을 위하여 2016년 10월 1일부터 2017년 9월 30일 동안 주요 포털사이트 39,436건, 종합일간지 10,387건, 건설전문지 3,36건을 포함해 총 53,759건 대상으로 분석하였고, 그 주요 결과는 다음과 같다. 첫째, 지난 1년간 해외건설 주요 이슈를 살펴보면, 여전히 중동 지역에 편중되고 저가 수주 위주의 플랜트 사업이 한계점이 두드러지게 나타났다. 전년 대비 2017년 상반기, 해외건설 수주가 다소 상승하는 추세를 보이기도 했으나 대외 정세의 불확실성과 국제유가의 하락 등으로 여전히 수주 불안정성을 보인다. 둘째, 최근 1년 해외건설 관련 이슈 중 해외건설 8대 핵심 키워드 기준으로 관심사를 분석한 결과, 지역(29.9%), 기업환경(22.0%), 수익성(17.0%), 단체(15.1%), 사업(5.2%), 시장환경(3.6%), 정책 및 제도(3.6%), 교육(3.5%) 순으로 나타났다. 셋째, 8개 키워드에 대한 총 30개의 이슈 후보 중 담론의 확산성과 지속성이 있는 10대 핵심 이슈를 추출하였다. 이를 토대로 해외건설 핵심 이슈별 상세분석 및 시사점을 도출하였다. 빅 데이터 분석을 통한 해외건설 빅 이슈를 도출한 결과 4차 산업혁명 시대의 도래에 대응하고 국내 건설업계의 위기 상황을 극복할 새로운 산업 패러다임의 대전환점을 맞이해야 하며 건설산업에 고부가가치 기술을 육성하여 수익 창출을 견인해 글로벌 건설경쟁력을 키워야 한다는 시사점이 도출되었다.

자연스러운 자세 제어를 위한 귀납적 역운동학 알고리즘 (Inductive Inverse Kinematics Algorithm for the Natural Posture Control)

  • 이범로;정진현
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제8권4호
    • /
    • pp.367-375
    • /
    • 2002
  • 역운동학 알고리즘은 다관절체의 엔드 이펙터를 제어하기 위한 매우 유용한 방법이다. 대부분의 역운동학 처리 과정에서 주된 관심사는 다관절체가 가지는 자세의 형태 자체가 아니라 제어되는 다관절체의 엔드 이펙터의 위치와 방향이다. 그러나 삼차원 캐릭터 애니메이션과 같은 종류의 응용 분야에 있어서는 엔드 이펙터의 정확한 위치와 방향보다는 다관절체의 전체적으로 자연스러운 자세 자체가 훨씬 더 중요한 요소이다. 실제로 애니메이터가 기존의 역운동학 기법을 사용해서 인체와 같이 다수의 물리적인 제약조건을 가지는 인간형 삼차원 캐릭터의 자세를 자연스럽게 제어하기 위해서는 많은 시행착오를 겪어야만 하기 때문에 이를 보완하는 특별한 알고리즘이 요구된다. CCD(Cyclic Coordinate Descent) 알고리즘은 기하학적인 검색을 통해 원하는 위치에 엔드 이펙터를 위치시키는 해를 구하는 역운동학 방식의 하나로서 사용자 상호작용을 통한 다관절체의 자세 제어에 적합하다. 그러나 CCD 알고리즘의 해는 초기 자세에 강력하게 종속되어 있기 때문에 초기 자세에 따라서 서로 다른 많은 해들을 얻게 된다. 본 논문에서는 인간형 캐릭터의 자세 제어를 위해 균등 자세 지도를 이용한 귀납적 역운동학 알고리즘을 제안한다. 균등자세 지도의 학습 알고리즘은 인간의 다양한 자세를 왜곡 없이 양자화하기 때문에 균등 자세 지도를 이용해서 기술되는 모든 자세들은 사실적인 자세임을 보장한다. 그러므로 균등 자세 지도를 통해 계산된 다관절체의 엔드 이펙터가 원하는 삼차원 위치와 가장 가까운 자세를 추출해 냄으로써 자연스러운 자세를 가지는 역운동학의 결과를 얻을 수 있다. 이러한 방식은 키 프레임 기반 삼차원 캐릭터 애니메이션의 제작과 3차원 게임, 그리고 가상 현실 등의 분야에 유용하게 적용될 수 있다.

고대 DNA의 분석과 검증 (Analysis and Verification of Ancient DNA)

  • 지상현;서민석
    • 헤리티지:역사와 과학
    • /
    • 제40권
    • /
    • pp.387-411
    • /
    • 2007
  • 고대 DNA분석은 인류학, 고고학, 생물학자뿐만 아니라 대중의 관심사가 될 정도로 점차 중요성이 강조되고 있다. 고고학자와 생물학자는 인류의 기원과 집단의 이주, 민족의 형성 그리고 고대인의 질병과 매장문화를 규명하는데 있어 고대 DNA분석을 접목하고 있으며, 이미 멸종된 동물의 계통진화학적인 연구에도 이를 활용하고 있다. 고대 DNA분석의 새로운 전기가 마련된 계기는 고대 시료에서 추출되는 미량의 DNA 증폭을 가능하게 한 종합효소연쇄반응(Polymerase chain reaction, PGR)법이 개발되면서였다. 그러나 고대 DNA는 탈아미노화나 절편화 등의 분자 손상 정도가 심한데 이것은 PCR에서 중합효소의 정확한 DNA 증폭을 방해하는 요인으로 작용한다. 시토신이 탈아미노화되어 우라실을 형성하는 것은 DNA의 염기치환오류를 일으킬 수 있으며, 이런 현상은 증폭 과정에서 고유의 염기서열에 대한 고정치환($C{\rightarrow}T$, $G{\rightarrow}A$)을 유도하게 된다. 또한 대부분의 고대시료는 외부 오염물에 노출되어 있는데, 특히 외부 DNA의 오염은 고대 DNA의 염기서열을 결정함에 있어서 부정확한 결과를 도출시키는 심각한 문제를 초래하곤 한다. 이와 같이 고대 시료는 오랜 기간 동안 자연 분해과정과 다양한 오염물질에 노출되어 있어 그 훼손 정도가 심한 것이 일반적이다. 고대 DNA 연구에 있어서 많은 생화학적 손상과 외부 DNA의 오염을 극복하기 위해서는 보통의 분자생물학적인 방법과 기준보다 더욱더 엄격한 검증 절차에 의하여 연구가 진행되어야 하며, 연구 결과의 신뢰성을 확보하는 것이 무엇보다 중요하다. 따라서 본 글에서는 고대 DNA의 손상과 오염물질에 의한 부정확한 염기서열결정과 오류를 보정하고 예방할 수 있는 연구 기준과 실험적 절차를 설명하고자 한다.

소셜미디어에 나타난 코로나 바이러스(COVID-19) 인식 분석 (Trend Analysis of Corona Virus(COVID-19) based on Social Media)

  • 윤상후;정상윤;김영아
    • 한국산학기술학회논문지
    • /
    • 제22권5호
    • /
    • pp.317-324
    • /
    • 2021
  • 본 연구는 국내 소셜미디어를 기반으로 코로나 확산 시기에 따른 코로나19 관심사 변화를 텍스트 기반으로 살펴 보았다. 연구자료는 2020년 1월 20일부터 8월 15일까지 네이버와 다음의 블로그와 카페에 올라온 글이다. 코로나 확산시기는 총 3단계로 분류하였다. 중국에서 발견된 코로나19가 한국에 확산되기 시작한 1월 20일부터 2월 17일을 '전조기', 대구를 중심으로 본격적 확산을 진행된 2월 18일부터 4월 20일을 '심각기', 그리고 일 확진자 수가 안정화되는 4월 21일부터 8월 15일을 '안정기'로 명명하였다. 코로나19와 연관된 상위 50개 단어를 추출하여 TF-IDF를 이용하여 군집 분석 하였다. 분석결과 전조기는 코로나 '상황'에 관련된 텍스트가 많았고, 심각기에는 '국가'와 '감염경로'에 관련된 텍스트가 많았다. 안정기에는 '치료'가 주로 언급되었다. 시기와 무관하게 공통적으로 언급이 많이 된 단어는 '감염', '마스크', '사람', '발생', '확진', '정보'이다. 시기별 감정의 변화를 살펴보면 시간이 지남에 따라 긍정의 비율이 높아지고 있다. 카페와 블로그는 글쓴이의 생각과 주관이 담긴 글을 인터넷을 통해 공유하므로 코로나19로 인한 비대면 시대의 주요 정보공유 공간이다. 그러나 정보전달의 선택성과 임의성이 존재하므로 소셜미디어에서 생산되는 정보를 비판적으로 바라보는 시각이 필요하다.

텍스트 문서 기반의 감성 인식 시스템 (An Emotion Scanning System on Text Documents)

  • 김명규;김정호;차명훈;채수환
    • 감성과학
    • /
    • 제12권4호
    • /
    • pp.433-442
    • /
    • 2009
  • 요즈음 인터넷을 통해 물건을 구매하는 경향이 증가하고 있다. 또한 물건을 구매한 소비자는 리뷰, 댓글, 비평 또는 블로그 등의 형식으로 온라인에 그들의 사용 후기를 작성한다. 또한 작성된 사용 후기부터 많은 구매자들은 물건을 구매하기 전에 자신이 구입하고자 하는 물건에 대한 정보를 얻는다. 따라서 회사나 공공기관은 대중이 다른 사람의 의견에 관심을 기울인다는 점 때문에 대중의 의견을 수집하고 분석할 필요성에 직면하였다. 그러나 온라인상에 댓글이 너무 많고, 중복적이면서 짧은 경향이 있다. 이러한 환경 속에서 텍스트 문서의 감성을 인식하는 시스템의 필요성이 대두되었다. 텍스트로부터 작성자의 의견이나 주관적인 생각을 추출할 수 있게 영어에서는 단어에 속성이 주어진 GI와 LKB가 있으나 한글은 아직 속성이 주어진 사전이 존재하지 않는다. 이 논문에서는 한글 품사 중 4개의 품사(명사, 동사, 형용사, 부사)에 속성을 주었다. 그리고 학습 군을 만들어서 감성 단어의 패턴을 구성하고, 문장에서 단어 사이의 공기관계를 구성하여 학습 시켰다. 이 학습을 바탕으로, SO-PMI을 이용하여 문서를 긍정과 부정 2가지 극성을 분류하고, 4개의 품사(명사, 동사, 형용사, 부사)를 각각 조합하여 최상의 조건을 구하였다. 마지막으로 사용자 인터페이스를 통해 새로운 감성 표현, 구성형식, 단어 연관성을 반자동적으로 삽입하고 교정할 수 있는 시스템을 설계하였다.

  • PDF

영화 추천 시스템의 초기 사용자 문제를 위한 장르 선호 기반의 클러스터링 기법 (Clustering Method based on Genre Interest for Cold-Start Problem in Movie Recommendation)

  • 유띳로따낙;누르지드;하인애;조근식
    • 지능정보연구
    • /
    • 제19권1호
    • /
    • pp.57-77
    • /
    • 2013
  • 소셜 미디어는 모바일 어플리케이션과 웹에서 가장 많이 사용되는 미디어 중 하나이다. Nielsen사의 보고서에 따르면 소셜 네트워크 서비스와 블로그가 온라인 사용자의 주 활동 공간으로 사용되고 있으며, 미국인 중에서 온라인 활동이 왕성한 5명의 사용자중 4명은 매일 소셜 네트워크 서비스와 블로그를 방문하고 온라인 활동 시간의 23%를 소비한다고 집계하고 있다. 미국의 인터넷 사용자들은 야후, 구글, AOL 미디어 네트워크, 트위터, 링크드인 등과 같은 소셜 네트워크 서비스중 페이스북에서 가장 많은 시간을 소비한다. 최근에는 대부분의 회사들이 자신의 특정 상품에 대하여 "페이스북 페이지(Facebook Page)"를 생성하고 상품에 대한 프로모션을 진행한다. 페이스북에서 제공되는 "좋아요" 옵션은 페이스북 페이지를 통해 자신이 관심을 가지는 상품(아이템)을 표시하고 그 상품을 지지할 수 있도록 한다. 많은 영화를 제작하는 영화 제작사들도 페이스북 페이지와 "좋아요" 옵션을 이용하여 영화 프로모션과 마케팅에 이용한다. 일반적으로 다수의 스트리밍 서비스 제공업들도 영화와 TV 프로그램을 즐기며 볼 수 있는 서비스를 사용자들에게 제공한다. 이 서비스는 일반 컴퓨터와 TV 등의 단말기에서인터넷을 통해 영화와 TV 프로그램을 즉각적으로 제공할 수 있다. 스트리밍 서비스의 선두 주자인 넷플릭스는 미국, 라틴 아메리카, 영국 그리고 북유럽 국가 등에 3천만 명 이상의 스트리밍 사용자가 가입되어 있다. 또한 넥플릭스는 다양한 장르로 구성된 수백만 개의 영화와 TV 프로그램을 보유하고 있다. 하지만 수많은 콘텐츠로 인해 사용자들은 자신이 선호하는 장르에 관련된 영화와 TV 프로그램을 찾기 위해 많은 시간을 소비해야 된다. 많은 연구자들이 이러한 사용자의 불편함을 줄이기 위해 아이템에 대한 사용자가 보지 않은 아이템에 대한 선호도를 예측하고 높은 예측값을 갖는 아이템을 사용자에게 제공하기 위한 추천 시스템을 적용하였다. 협업적 여과 방법은 추천 시스템을 구축하기 위해 가장 많이 사용되는 방법이다. 협업적 여과 시스템은 사용자들이 평가한 아이템을 기반으로 각 사용자 간의 유사도를 측정하고 목적 사용자와 유사한 성향을 가진 사용자 그룹을 결정한다. 군집된 그룹은 이웃 사용자 집단으로 불리며 이를 이용하여 특정 아이템에 대한 선호도를 예측하고, 예측 값이 높은 아이템을 목적 사용자에게 추천해 준다. 협업적 여과 방법이 적용되는 분야는 서적, 음악, 영화, 뉴스 및 비디오 등 다양하지만 논문에서는 영화에 초점을 맞춘다. 이 협업적 여과 방법이 추천 시스템 내에서 유용하게 활용되고 있지만 아직 "희박성 문제"와 "콜드 스타트 문제" 등 해결해야 할 과제가 남아있다. 희박성 문제는 아이템의 수가 증가할수록 아이템에 대한 사용자의 로그 밀도가 감소하는 것이다. 즉, 전체 아이템 수에 비해 사용자가 아이템에 대해 평가한 정보가 충분하지 않기 때문에 사용자의 성향을 파악하기 어렵고, 이로 인해 사용자가 아직 평가하지 않은 아이템에 대해서 선호도를 추측하기 어려운 것을 말한다. 이 희박성 문제가 포함된 경우 적합한 이웃 사용자 집단을 형성하는데 어려움을 겪게 되고 사용자들에게 제공되는 아이템 추천의 질이 떨어지게 된다. 콜드 스타트 문제는 시스템 내에 새로 들어온 사용자 또는 아이템으로 지금까지 한 번도 평가를 하지 않은 경우에 발생한다. 즉, 사용자가 평가한 아이템에 대한 정보가 전혀 포함되어 있지 않거나 매우 적기 때문에 이러한 경우 또한 적합한 이웃 사용자 집단을 형성하는데 어려움을 겪게 되고 사용자가 평가하지 않은 아이템에 대한 선호도 예측의 정확성이 감소되게 된다. 본 논문에서는 영화 추천 시스템에서 발생될 수 있는 초기 사용자 문제를 해결하기 위하여 사용자가 평가한 영화와 소셜 네트워크 서비스로부터 추출된 사용자 선호 장르를 활용하여 사용자 군집을 형성하고 이를 활용하는 방법을 제안한다. 소셜 네트워크 서비스로부터 사용자가 선호하는 영화 장르를 추출하기 위해 페이스북 페이지의 '좋아요' 옵션을 이용하며, 이 '좋아요' 정보를 분석하여 사용자의 영화 장르 관심사를 추출한다. 페이스북의 영화 페이지는 각 영화를 위한 페이스북 페이지로 구성되고 있으며, 사용자는 자신의 선호도에 따라서 "좋아요" 옵션을 선택할 수 있다. 사용자의 페이스북 정보는 페이스북 그래프 API를 활용하여 추출되고 이로부터 사용자 선호 영화를 알 수 있게 된다. 시스템에서 활용되는 영화 정보는 인터넷 영화 데이터베이스인 IMDb로부터 획득한다. IMDb는 수많은 영화와 TV 프로그램을 보유하고 있으며, 각 영화에 관련된 배우 정보, 장르 및 부가 정보들을 포함한다. 논문에서는 사용자가 "좋아요" 표시를 한 영화 페이지를 이용하여 IMDb로부터 영화 장르 정보를 가져온다. 그리고 추출된 영화 장르 선호도와 본 시스템에서 제안하는 영화 평가 항목을 이용하여 유사한 이웃 사용자 집단을 구성한 후, 사용자가 평가하지 않은 아이템에 대한 선호도를 예측하고, 높은 예측 값을 갖는 아이템을 사용자에게 추천한다. 본 논문에서 제안한 사용자의 선호 장르 기반의 사용자 군집 기법을 이용한 시스템을 평가하기 위해서 IMDb 데이터 집합을 이용하여 사용자 영화 평가 시스템을 구축하였고 참가자들의 영화 평가 정보를 획득하였다. 페이스북 영화 페이지 정보는 참가자들의 페이스북 계정과 페이스북 그래프 API를 통해 획득하였다. 사용자 영화 평가 시스템을 통해 획득된 사용자 데이터를 제안하는 방법에 적용하였고 추천 성능, 품질 및 초기 사용자 문제를 벤치마크 알고리즘과 비교하여 평가하였다. 실험 평가의 결과 제안하는 방법을 적용한 추천 시스템을 통해 추천의 품질을 10% 향상시킬 수 있었고, 초기 사용자 문제에 대해서 15% 완화시킬 수 있음을 볼 수 있었다.

인터넷 검색기록 분석을 통한 쇼핑의도 포함 키워드 자동 추출 기법 (A Methodology for Extracting Shopping-Related Keywords by Analyzing Internet Navigation Patterns)

  • 김민규;김남규;정인환
    • 지능정보연구
    • /
    • 제20권2호
    • /
    • pp.123-136
    • /
    • 2014
  • 최근 온라인 및 다양한 스마트 기기의 사용이 확산됨에 따라 온라인을 통한 쇼핑구매가 더욱 활성화 되었다. 때문에 인터넷 쇼핑몰들은 쇼핑에 관심이 있는 잠재 고객들에게 한 번이라도 더 자사의 링크를 노출시키기 위해 키워드에 비용을 지불할 용의가 있으며, 이러한 추세는 검색 광고 시장의 광고비를 증가시키는 원인을 제공하였다. 이 때 키워드의 가치는 대체로 검색어의 빈도수에 기반을 두어 산정된다. 하지만 포털 사이트에서 검색어로 자주 입력되는 모든 단어가 쇼핑과 관련이 있는 것은 아니며, 이들 키워드 중에는 빈도수는 높지만 쇼핑몰 관점에서는 별로 수익과 관련이 없는 키워드도 다수 존재한다. 그렇기 때문에 특정 키워드가 사용자들에게 많이 노출된다고 해서, 이를 통해 구매가 이루어질 것을 기대하여 해당 키워드에 많은 광고비를 지급하는 것은 매우 비효율적인 방식이다. 따라서 포털 사이트의 빈발 검색어 중 쇼핑몰 관점에서 중요한 키워드를 추출하는 작업이 별도로 요구되며, 이 과정을 빠르고 효과적으로 수행하기 위한 자동화 방법론에 대한 수요가 증가하고 있다. 본 연구에서는 이러한 수요에 부응하기 위해 포털 사이트에 입력된 키워드 중 쇼핑의도를 포함하고 있을 가능성이 높을 것으로 추정되는 키워드만을 자동으로 추출하는 방안을 제시하고, 구체적으로는 전체 검색어 중 검색결과 페이지에서 쇼핑과 관련 된 페이지로 이동한 검색어만을 추출하여 순위를 집계하고, 이 순위를 전체 검색 키워드의 순위와 비교하였다. 국내 최대의 검색 포털인 'N'사에서 이루어진 검색 약 390만 건에 대한 실험결과, 제안 방법론에 의해 추천된 쇼핑의도 포함 키워드가 단순 빈도수 기반의 키워드에 비해 정확도, 재현율, F-Score의 모든 측면에서 상대적으로 우수한 성능을 보이는 것으로 나타남을 확인할 수 있었다.