Search | Korea Science

A Methodology for Extracting Shopping-Related Keywords by Analyzing Internet Navigation Patterns (인터넷 검색기록 분석을 통한 쇼핑의도 포함 키워드 자동 추출 기법)

Kim, Mingyu;Kim, Namgyu;Jung, Inhwan
- Journal of Intelligence and Information Systems
- /
- v.20 no.2
- /
- pp.123-136
- /
- 2014
Recently, online shopping has further developed as the use of the Internet and a variety of smart mobile devices becomes more prevalent. The increase in the scale of such shopping has led to the creation of many Internet shopping malls. Consequently, there is a tendency for increasingly fierce competition among online retailers, and as a result, many Internet shopping malls are making significant attempts to attract online users to their sites. One such attempt is keyword marketing, whereby a retail site pays a fee to expose its link to potential customers when they insert a specific keyword on an Internet portal site. The price related to each keyword is generally estimated by the keyword's frequency of appearance. However, it is widely accepted that the price of keywords cannot be based solely on their frequency because many keywords may appear frequently but have little relationship to shopping. This implies that it is unreasonable for an online shopping mall to spend a great deal on some keywords simply because people frequently use them. Therefore, from the perspective of shopping malls, a specialized process is required to extract meaningful keywords. Further, the demand for automating this extraction process is increasing because of the drive to improve online sales performance. In this study, we propose a methodology that can automatically extract only shopping-related keywords from the entire set of search keywords used on portal sites. We define a shopping-related keyword as a keyword that is used directly before shopping behaviors. In other words, only search keywords that direct the search results page to shopping-related pages are extracted from among the entire set of search keywords. A comparison is then made between the extracted keywords' rankings and the rankings of the entire set of search keywords. Two types of data are used in our study's experiment: web browsing history from July 1, 2012 to June 30, 2013, and site information. The experimental dataset was from a web site ranking site, and the biggest portal site in Korea. The original sample dataset contains 150 million transaction logs. First, portal sites are selected, and search keywords in those sites are extracted. Search keywords can be easily extracted by simple parsing. The extracted keywords are ranked according to their frequency. The experiment uses approximately 3.9 million search results from Korea's largest search portal site. As a result, a total of 344,822 search keywords were extracted. Next, by using web browsing history and site information, the shopping-related keywords were taken from the entire set of search keywords. As a result, we obtained 4,709 shopping-related keywords. For performance evaluation, we compared the hit ratios of all the search keywords with the shopping-related keywords. To achieve this, we extracted 80,298 search keywords from several Internet shopping malls and then chose the top 1,000 keywords as a set of true shopping keywords. We measured precision, recall, and F-scores of the entire amount of keywords and the shopping-related keywords. The F-Score was formulated by calculating the harmonic mean of precision and recall. The precision, recall, and F-score of shopping-related keywords derived by the proposed methodology were revealed to be higher than those of the entire number of keywords. This study proposes a scheme that is able to obtain shopping-related keywords in a relatively simple manner. We could easily extract shopping-related keywords simply by examining transactions whose next visit is a shopping mall. The resultant shopping-related keyword set is expected to be a useful asset for many shopping malls that participate in keyword marketing. Moreover, the proposed methodology can be easily applied to the construction of special area-related keywords as well as shopping-related ones.
https://doi.org/10.13088/jiis.2014.20.2.123 인용 PDF KSCI

Ontology based SBML Converter (온톨로지 기반의 SBML 변환기)

임정곤;김태경;정태성;조완섭
- Proceedings of the Korean Information Science Society Conference
- /
- 2004.10b
- /
- pp.259-261
- /
- 2004
최근 이슈가 되고 있는 시스템 생물학(Systems Biology)은 생물학적인 이론과 컴퓨터의 계산적인 모델링 그리고 실험의 상호 의존적인 통합으로써 특징 지워진다. 그 중 컴퓨터의 계산적인 모델링에 대한 연구가 무엇보다 중요한 비중을 차지하고 있다. 하지만 계산적인 모델링에서 여러 자원을 통합하기 위한 공통의 기반 구조나 표준에 대한 연구는 미흡한 실정이다. 이러한 문제점을 해결하기 위해 KML 기반의 형식을 갖춘 SBML(Systems Biology Markup Language)이 시스템 생물학의 표준으로 개발되어 연구 중에 있다. 현재 시스템 생물학 분야에서 개발중인 시뮬레이션과 데이터 분석을 위한 다양한 응용 어플리케이션이 이미 SBML 문서를 지원하고 있다. 본 연구에서는 시스템 생물학 분야에서 SBML 표준에 대한 중요성을 인식하여, 객체지향 바이오 데이터베이스로부터 질의 결과를 SBML 문서로 변환하고, 반대로 외부의 SBML 문서를 객체지향 데이터베이스에 저장하는 변환기를 제안하며, 데이터를 검색하고 저장하는데 발생하는 중복이나 동의어 관계의 모호성을 줄이고 정확성을 높이기 위한 방안으로 온톨로지 기법을 적용한다.
PDF

Automatic Foreign Word Transliteration Model for Information Retrieval (정보검색을 위한 외래어 자동표기 모델)

이재성;최기선
- Proceedings of the Korean Society for Information Management Conference
- /
- 1997.08a
- /
- pp.17-24
- /
- 1997
조사에 따르면 한글 문서에서 사용되는 단어 중 외래어 또는 영어가 포함된 단어가 약 26%정도를 차지하고 있으며, 이는 정보검색의 중요 색인어로 사용된다(권윤형 1996). 그러나 이들 단어들은 서로 같은 단어인데도 영어로 표기되기도 하고 이형의 외래어들로 표기되기도 하여, 정보검색의 효율을 떨어뜨리고 있다. 본 논문에서는 영어 단어와 그에 대응되어 표기되는 외래어들을 찾기 위한 한 단계로서, 영어를 한글로 음차(transliteration)하여 자동표기하는 통계적 모델을 제안하고 실험한다. 제안된 모델은 통계적 기계번역 방식과 그의 한 방법인 문서 정렬(text alignment) 방식에 근거하고 있다. 특히 이 모델에서는 효과적으로 발음의 단위를 분리한 다음 정렬을 하여. 전체적인 계산량을 줄이고 성능도 향상시켰다. 음차표기는 피봇방식과 직접방식의 두가지로 구현하였다. 피봇방식은 영어에서 발음을 생성한 후, 그 발음을 다시 한글로 표기하는 방식이고, 직접방식은 직접 영어 단어에서 한글 표기로 포기하는 방식이다. 두 방식을 제안된 모델을 이용하여 비교 테스트한 결과 직접방식이 보다 정확하게 표준 외래어로 표기하였다.
PDF

산업 - 세계의 항공우주기구(14) - 에콰도르 민간 우주기구 EXA

한국항공우주산업진흥협회
- Aerospace Industry
- /
- s.107
- /
- pp.66-67
- /
- 2010
공용어로 스페인어를 사용하며 통화는 미국 달러를 사용하는 에콰도르 공화국(Republic del Ecuador)은 남아메리카 북서부에 위치한 중소국가다. 미주 기구(OAS), 석유수출국 기구(OPEC), 남아메리카 국가 연합(UNASUR), 라틴어 연합(Latin Union) 등에 가입되어 있고 활발한 대외활동을 펼치고 있다. 그럼에도 불구하고 사실 에콰도르의 대외 위상은 그리 높지 않다. 생태학적으로 중요한 갈라파고스 제도가 에콰도르의 영토라는 사실을 아는 사람이 극히 적을 정도로 에콰도르는 우리에게 먼 나라다. 그러나 최근 에콰도르는 항공우주분야에서 급격한 두각을 나타내고 있다. 2007년 11월 설립된 에콰도르 민간 우주기구(La Agencia Espacial Civil Ecuatoriana)를 중심으로 우주개발에 적극 뛰어들고 있기 때문이다. 에콰도르 최초의 우주인을 배출하고 주요 항공우주 선진국과 협력을 강화해 나가고 있는 에콰도르 민간 우주기구의 활약을 소개한다.
PDF

A Korean Speech Database for Use in Automatic Translation (자동통역용 한국어 음성 데이터베이스)

최인정
- Proceedings of the Acoustical Society of Korea Conference
- /
- 1994.06c
- /
- pp.287-290
- /
- 1994
음성 인식 시스템의 개발을 위해서는 음성 데이터베이스구축이 중요한 과제의 하나로서, 많은 시간과 노력이 요구된다. 개별적인 음성데이타베이스 구축에 따른 중복 투자를 줄이고 다양한 인식 알고리듬의 성능 비교와 국내 음성 인식 기술의 발전을 위해서는 벤치마크 시험을 위한 공통의 음성 데이터베이스가 필수적이다. 본 논문에서는 한국과학기술원 통신연구실에서 제작한 한국어 음성 데이터베이스에 관하여 기술한다. KAIST 음성데이타베이스는 자동통ㅇ역을 N이한 무역 상담과 관련되 3,000 단어 규모의 연속어를 비롯하여, 가변 길이 연결 숫자음, phoneme-balanced 75 고립단어, 지역명 관련 500 고립단어, 한국어 아-세트로 구성되어 있다. 이 음성 데이터베이스의 구축을 위하여 사용된 태스크선정 절차, 녹음 방법, 규격, 및 기대효과 등 세부사항을 기술한다.
PDF

A Study on the Correlation between Frequency Components and Sound Quality of a Vacuum Cleaner using the Orthogonal Array (직교배열표를 이용한 진공 청소기의 음질과 주파수 특성의 상관 관계에 관한 연구)

Lim Do-Hyeong;Jeong Hyuk;Ih Jeong-Guon
- Proceedings of the Acoustical Society of Korea Conference
- /
- spring
- /
- pp.295-298
- /
- 2000
제품의 음질 특성과 관련된 주요 주파수 대역을 파악하기 위해 본 연구에서는 청소기 소리의 주파수 대역을 음성인식에 중요한 주파수 대역인 4개의 대역으로 나누고, 각 대역 성분을 직교배열표에 따라 가감한 16개의 소리를 만들었다 만들어진 소리에 대해 10명을 대상으로 4가지의 표현어로 Semantic Differential Method(SDM)로 주관적 평가를 하여, 청소기음의 주파수 특성과의 상관관계를 살펴보았다. 불쾌한 느낌과 관련이 깊은 주파수 대역은 고주파수 대역이었으며, 성능이 좋은 느낌을 주기 위해서는 저주파수 대역을 증가시키는 것 이 효과적이었다.
PDF

The Status Analysis of Computer Game Addiction Prevention Site (컴퓨터게임중독 예방 사이트의 현황 분석)

Chung A-Ran;Lee Jeong-Gi;Lee Joon
- Proceedings of the Korea Information Processing Society Conference
- /
- 2006.05a
- /
- pp.797-800
- /
- 2006
인터넷 보급률이 증가 하면서 순기능에 이어 역기능이 보이기 시작하였다. 그중 우리나라 모든 부모들에게 경종을 울리는 것이 청소년의 게임중독일 것이다. 인터넷은 정보사회를 앞서 나가기 위한 최첨단 기술이자 무기로만 여겨왔던 컴퓨터와 인터넷이 자녀 교육에 도움이 되는 중요한 교구라고 믿던 부모는 시간이나 때우고 게임이나 하는 심지어 밤을 새우는 인터넷의 문제의 심각성을 깨달았기 때문에 무지에서 무조건적으로 게임은 안된다는 결론을 내리면서 청소년들은 어디에도 도움을 청할 곳이 없어 방황하게 되는 것이다. 본 논문에서는 국내외 게임중독 예방 사이트 운영 실태를 파악하고 유료 상담을 받기 어려운 청소년이 쉽게 게임중독에 예방 및 무료 상담할 수 있는 사이트를 분석 후 대응 방안을 제시하고자 한다.
PDF

Inducing Subsumption Conditions for Morphological Ambiguity Reduction (형태소의 모호성 축소를 위한 포섭조건의 자동 추론)

Kim, Jae-Hoon;Jang, Byung-Gyu;Kim, Gil-Chang;Seo, Jung-Yun
- Annual Conference on Human and Language Technology
- /
- 1995.10a
- /
- pp.175-180
- /
- 1995
한국어는 교착어이기 때문에 형태소 해석은 자연언어 처리에서 매우 중요한 역할을 담당한다. 한국어 형태소 해석에서 주로 사용되는 정보는 두 형태소의 결합 가능 유무를 나타내는 접속정보이다. 이 접속정보는 단순한 품사정보에 의해서 표현되기 때문에 형태소 해석기의 과잉 해석의 원인이 된다. 이를 줄이기 위해 언어 지식의 일종인 포섭관계가 제안되었다[5]. 그러나, 포섭관계를 검사하기 위한 포섭조건들은 수작업에 의해서 작성되었다. 수작업으로 작성된 이들 조건들은 일관성 유지하기 어려울 뿐 아니라 완전한 조건들을 구하기도 어렵다. 따라서, 본 논문에서는 이와 같은 문제를 해소하기 위해서 품사 태깅된 말뭉치를 이용해서 포섭조건의 자동 추출방법을 제안한다.
PDF

A Question Answering Using Syntactic Structure for Answer Extraction (구문구조를 이용하여 정답을 추출하는 질의응답 시스템)

Yi, Dae-Yeon;Seo, Young-Hoon
- Annual Conference on Human and Language Technology
- /
- 2003.10d
- /
- pp.89-94
- /
- 2003
본 논문에서는 질의문 내에 포함된 동사를 중심으로 한 질의어 확장 및 정답 추출 기법을 이용한 질의 응답 시스템에 대해 기술한다. 질의 응답시스템 전체의 과정에서 동사는 하나의 정보를 표현하는 중요한 요소로 활용하며, 동사에 대한 활용은 구축된 동사구문 사전의 정보를 이용한다. 동사구문 사전은 동사의 일반적인 표층형태와, 각 문장 성분들의 의미속성, 유의동사 등의 정보를 담고 있다. 또한 동사 구문사전의 활용에서의 동사 모호성을 배제하고, 효율을 높이기 위해 약 3만 어휘의 명사 의미 사전을 사용한다. 명사 의미사전은 구문사전 내에 사용된 의미분류로 나누어져 있으며, 유의명사 및 국어사전 상의 뜻 풀이말을 포함하고 있다. 질의문 및 각 후보 문장에 대한 구문분석은 구문사전 내에 나타난 품사 별 의미속성과, 문법 형태소의 격 정보를 이용한 격 구조를 활용하였다. 논문 중에는 일반적인 질의 응답 시스템의 3단계에 맞추어 구문사전 활용 및 구문분석의 수행 단계를 보이고 마지막에 각 기법의 정확도를 보였다.
PDF

GMO(유전자변형식품) - 농업혁명인가? 인류재앙인가? - GMO기술, 자체보다 적정 사용여부가 중요 - 걸음마단계의 유전공학 농업, 제도 마련해야

한국농약공업협회
- Agrochemical news magazine
- /
- v.22 no.6 s.169
- /
- pp.22-23
- /
- 2001
만일 미국인 소비자들에게 식품과 농산물에 생명공학을 적용하는 것을 지지하느냐고 물으면 그들 중 약 $70\%$는 ''그렇다''고 답할 것이다. 하지만 질문의 각도를 좀 달리해서 ''당신은 유전자변형식품(GMO)을 먹어도 된다고 생각하는가''라고 묻는다면 3분의 2가량은 ''아니다''고 대답할 것이다. 하지만 이 두가지 질문은 사실상 같은 것이다. 다만 두번째 질문속의 ''유전자''와 ''변형'' 같은 말들이 수백만명의 소비자들의 경계심리를 자극하는 것이다. GMO 기술은 적절하게만 사용된다면 식품의 영양을 개선하고 농업생산량을 증대시켜 농가소득을 높이고 심지어 환경적 위해 요소를 줄일 수 있다. 하지만 이 기술이 현재 부적절하게 시험되고 잘못 적용되는 등 불완전하게 규제될 경우 영양학적으로나 환경적으로 큰 위해로 작용할 수 있다. 따라서 이에 대한 정확한 이해와 득실을 알아 둘 필요가 있다.
PDF

Search Result 870, Processing Time 0.024 seconds

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)