• 제목/요약/키워드: Technology Sharing

검색결과 2,060건 처리시간 0.035초

MIS Quarterly 연구동향 탐색: 토픽모델링 및 키워드 네트워크 분석 활용 (An Exploration of MIS Quarterly Research Trends: Applying Topic Modeling and Keyword Network Analysis)

  • 강은경;정연식;양선욱;권지윤;양성병
    • 지능정보연구
    • /
    • 제28권2호
    • /
    • pp.207-235
    • /
    • 2022
  • 지식과 정보산업이 경제의 주축인 지식기반 사회에 있어 지식의 공유와 확산 및 체계적인 관리는 국가 경쟁력 향상뿐만 아니라 지속 가능한 사회 발전의 필수 전략으로 인식되고 있다. 정보기술과 경영의 융합이 다양한 방식으로 일어나고 있는 정보시스템(Information Systems: IS) 연구분야에서, 연구자들이 서로 협력하여 오래된 지식을 과학적 지식네트워크의 관점에서 새로운 지식으로 만들어 낼 때 비로소 지식의 진화가 일어난다. 특히, 인용과 공저, 키워드와 같은 네트워크 기반의 학제적 접목을 통해 해당 연구분야의 관심 주제와 적용된 방법론, 연구동향 등을 파악함으로써 새로운 통찰을 이끌어낼 수 있다. 선행연구에서는 연구주제와 방법론, 공동저자 등의 관계를 밝혀 해당 커뮤니티의 지식체계 구조와 연구동향을 파악하려는 다양한 시도가 있어 왔으나, 두 개 이상의 저널을 일부 기간으로 한정해서 비교한 연구가 대부분을 차지하였으며, IS 연구의 전 역사를 아우르면서 연구동향을 살펴본 연구는 부족한 실정이다. 이에 본 연구에서는 IS 연구분야에서 관련 지식을 넓히는 데 주도적인 역할을 수행하고 있는 MIS Quarterly (MISQ) 저널을 중심으로 창간호(1977년)부터 최근(2022년 1분기)까지 게재된 모든 논문으로부터 (1) 키워드를 추출하고, (2) 추출된 키워드를 연구주제와 방법론, 이론 등으로 각각 구분한 후, (3) 토픽모델링과 키워드 네트워크 분석을 활용하여 IS 연구분야의 태동부터 현재까지의 변화 양상을 연대기적으로 파악하였다. 본 연구를 통해 MISQ에 게재된 IS 연구의 변화 양상을 살펴봄으로써, IS 연구분야의 발전 방향을 예측하고, IS 분야의 연구자들에게 새로운 연구방향을 제시하여 미래 지향적인 연구를 진행하는 데 실질적인 도움을 줄 수 있을 것으로 기대한다.

국내 시청각 기록관리 정책 리더십 및 전문성 제고 방안 연구 (A Study on Policy-making, Leadership and Improvement of Professionalism for Audiovisual Archives Management in Korea)

  • 최효진
    • 기록학연구
    • /
    • 제72호
    • /
    • pp.91-163
    • /
    • 2022
  • 본 논문에서는 '유튜브' 등을 비롯한 온라인동영상 플랫폼 활용이 일반화되고 고화질·고용량 시청각 기록의 생산·수집량이 급증하는 상황에서도 공공·민간 부문 모두에서 시청각 기록의 '관리'와 '활용'은 여전히 전문화되고 있지 않은 상황에 주목하였다. 공공기관이나 방송사, 일반 기업이나 단체 등 시청각 기록을 생산하는 주체들이 기본적으로 참고할만한 '시청각 기록관리 매뉴얼' 등이 부재할 뿐만 아니라 현행 『공공기록물법』 및 동법 시행령·시행규칙, 공공표준, 지침 및 매뉴얼 등 공공기록관리에서조차 시청각 기록관리의 원칙을 제시하지 못한 가운데 중앙기록물관리기관인 '국가기록원'의 역할이 매우 중요한 점을 강조하고자 했다. 이를 위해 본 논문에서는 현행 『공공기록물법』의 시청각 기록 관련 조항을 분석하고 제·개정 필요성을 살펴보았다. 또한, 현재 국가기록원의 시청각 기록 표준화 현황을 검토하고 공공기록관리 부문에서 효율적인 시청각 기록관리를 위해 제도적으로 마련한 제도와 지침을 분석하여, 기록관리 현장에서 해당 제도 및 지침들이 시청각 기록을 관리하는 데 어떤 기능을 하고 있는지 알아보고자 하였다. 이를 통해 현행 국내 법·제도 개선의 필요성, 관련 공공표준 및 지침 내용 개정 방향 등을 제시하였으며, '국가기록원' 등의 시청각 기록관리 정책 기능을 활성화하는 방안과 시청각 기록관리 및 관련 정책을 담당한 전문기구인 '공공영상'아카이브 신설 필요성 또한 검토하였다. '공공영상'아카이브는 영상납본제 등을 통한 체계적이고 망라적으로 '공공영상'을 수집하고 이를 사회적 기억으로서 공적 활용될 수 있도록 관리·활용 체계를 운영한다. 이 과정에서 '공공영상' 보호(Safeguarding)와 관련한 기술 표준화, 저작권 및 초상권 권리보호 등 시청각 기록관리와 관련한 전문적 역할을 수행한다.

2021 Korean Thyroid Imaging Reporting and Data System and Imaging-Based Management of Thyroid Nodules: Korean Society of Thyroid Radiology Consensus Statement and Recommendations

  • Eun Ju Ha;Sae Rom Chung;Dong Gyu Na;Hye Shin Ahn;Jin Chung;Ji Ye Lee;Jeong Seon Park;Roh-Eul Yoo;Jung Hwan Baek;Sun Mi Baek;Seong Whi Cho;Yoon Jung Choi;Soo Yeon Hahn;So Lyung Jung;Ji-hoon Kim;Seul Kee Kim;Soo Jin Kim;Chang Yoon Lee;Ho Kyu Lee;Jeong Hyun Lee;Young Hen Lee;Hyun Kyung Lim;Jung Hee Shin;Jung Suk Sim;Jin Young Sung;Jung Hyun Yoon;Miyoung Choi
    • Korean Journal of Radiology
    • /
    • 제22권12호
    • /
    • pp.2094-2123
    • /
    • 2021
  • Incidental thyroid nodules are commonly detected on ultrasonography (US). This has contributed to the rapidly rising incidence of low-risk papillary thyroid carcinoma over the last 20 years. The appropriate diagnosis and management of these patients is based on the risk factors related to the patients as well as the thyroid nodules. The Korean Society of Thyroid Radiology (KSThR) published consensus recommendations for US-based management of thyroid nodules in 2011 and revised them in 2016. These guidelines have been used as the standard guidelines in Korea. However, recent advances in the diagnosis and management of thyroid nodules have necessitated the revision of the original recommendations. The task force of the KSThR has revised the Korean Thyroid Imaging Reporting and Data System and recommendations for US lexicon, biopsy criteria, US criteria of extrathyroidal extension, optimal thyroid computed tomography protocol, and US follow-up of thyroid nodules before and after biopsy. The biopsy criteria were revised to reduce unnecessary biopsies for benign nodules while maintaining an appropriate sensitivity for the detection of malignant tumors in small (1-2 cm) thyroid nodules. The goal of these recommendations is to provide the optimal scientific evidence and expert opinion consensus regarding US-based diagnosis and management of thyroid nodules.

북서태평양에 서식하는 살오징어(Todarodes pacificus) 계군 분석에 대한 고찰 (Stock Identification of Todarodes pacificus in Northwest Pacific)

  • 김정연;문창호;윤문근;강창근;김경렬;나태희;최은정;이충일
    • 한국해양학회지:바다
    • /
    • 제17권4호
    • /
    • pp.292-302
    • /
    • 2012
  • 본 종설논문은 살오징어의 기존 및 최근에 새롭게 적용되고 있는 계군 분석방법들을 비교 분석하여 각 분석방법의 장단점과 분석방법간의 상호보완에 대하여 고찰하였다. 살오징어는 북서태평양의 넓은 지역을 회유하는 어종으로 생태계 및 상업적으로 중요한 자원이다. 살오징어는 해양환경변화의 생물학적 지표로서의 가능성을 평가 받고 있으며, 장단기적인 어획량 및 분포역의 변화가 환경 변화와 함께 나타난다. 예를 들어, 1987/1988 무렵에 발생한 기후체제전환 이후 한류성 어종으로 분류되는 명태의 어획량은 급감하여 현재까지 그 영향이 지속되고 있는 반면, 살 오징어 어획량은 크게 증가하였다. 현재까지 명태 어획량의 감소에 대하여 남획과 기후변화에 초점이 맞추어진 해석이 있으나, 뚜렷한 원인 분석은 이루어지지 않고 있다. 그 이유 중 한 가지는 계군 분석에 근거한 생태, 환경적 측면에 대한 정확한 원인 분석이 이루어지지 않고 있는 것과 관련이 된다. 계군은 유사한 생물학적 특징을 가진 개체들이 제한된 영역 내에서 유성생식과정을 통하여 동일한 유전자 풀(gene pool)을 공유하는 집단으로, 동일 계군을 형성하는 개체들은 산란에서 자원으로 가입 후 다시 재생산 과정에 이르기까지 시간 및 공간적으로 각기 다른 환경의 영향을 받을 수 있다. 따라서, 종에 대한 정확한 계군 분석은 자원의 효과적인 관리 및 급격한 변화에 대한 중요한 대응 방안의 역할을 할 수 있다. 살오징어 계군 분석에 적용된 주요 방법은 크게 4가지로 형태학적 방법, 생태학적 방법, 표지방류법, 유전학적 방법이 있다. 형태학적인 방법은 분석방법이 가장 간단하고 다수의 개체를 비교적 쉽게 분석할 수 있지만 각 형질들은 성장기간 동안 환경에 의해 영향을 많이 받게 되어 개체간의 차이가 생긴다. 생태학적 방법은 주로 개체의 생리적인 변화와 분포 및 회유상태, 기생충의 기생상태나 종류 및 기생률 등을 분석, 산란장의 차이를 알아보는 연구이며, 현재 활발히 연구되고 있는 방법으로 유사한 환경에서 생활하는 집단을 알 수 있지만 유전적으로 같은 집단인지는 알기 어렵다. 표지방류법은 직접적인 방법으로 계군의 회유 및 분포, 산란장의 위치를 파악할 수 있지만 수거가 어렵고 초기 단계에는 표식을 하기 어렵다. 수산생물의 계군 분석을 위한 유전학적 방법은 자원관리학적 연구에 관한 기본적 정보를 제공해 왔다. 계군 분석을 위한 유전학적 방법은 이에 사용하는 유전자 마커(marker)의 감도에 따라 결정되며, 유전자 마커의 다형성이 높은 것을 선택해야 한다. 계군 분석을 위한 유전자 마커로는 오랜 기간 동안 동위효소 다형이 사용되어졌으며, 최근에는 mitochondria, microsatellite와 같이 DNA 염기배열 중에서도 변이성이 높은 영역을 선택하여 마커로 이용한 연구가 증가되고 있다. 기존의 형태학적 방법, 표지방류법, 생태학적인 방법들은 살오징어의 생활사, 회유경로, 산란장의 변화 등을 밝혀내어 계군을 파악하는데 많은 기여를 하였지만 여전히 각 해역에 분포하는 살오징어의 계군을 파악하기에는 어려움이 있다. 최근에는 기존의 계군 분석이 지닌 장단점을 비교 분석하여 복합적인 방법의 계군 분석이 이루어지며, 이러한 정보들을 바탕으로 유전학적 방법을 보완한다면 살오징어 자원의 변동에 대한 관리 방안을 마련하는데 도움을 줄 것이다.

참여자관점에서 공급사슬관리 시스템의 성공에 영향을 미치는 요인에 관한 실증연구 (An Empirical Study on the Determinants of Supply Chain Management Systems Success from Vendor's Perspective)

  • 강성배;문태수;정윤
    • Asia pacific journal of information systems
    • /
    • 제20권3호
    • /
    • pp.139-166
    • /
    • 2010
  • The supply chain management (SCM) systems have emerged as strong managerial tools for manufacturing firms in enhancing competitive strength. Despite of large investments in the SCM systems, many companies are not fully realizing the promised benefits from the systems. A review of literature on adoption, implementation and success factor of IOS (inter-organization systems), EDI (electronic data interchange) systems, shows that this issue has been examined from multiple theoretic perspectives. And many researchers have attempted to identify the factors which influence the success of system implementation. However, the existing studies have two drawbacks in revealing the determinants of systems implementation success. First, previous researches raise questions as to the appropriateness of research subjects selected. Most SCM systems are operating in the form of private industrial networks, where the participants of the systems consist of two distinct groups: focus companies and vendors. The focus companies are the primary actors in developing and operating the systems, while vendors are passive participants which are connected to the system in order to supply raw materials and parts to the focus companies. Under the circumstance, there are three ways in selecting the research subjects; focus companies only, vendors only, or two parties grouped together. It is hard to find researches that use the focus companies exclusively as the subjects probably due to the insufficient sample size for statistic analysis. Most researches have been conducted using the data collected from both groups. We argue that the SCM success factors cannot be correctly indentified in this case. The focus companies and the vendors are in different positions in many areas regarding the system implementation: firm size, managerial resources, bargaining power, organizational maturity, and etc. There are no obvious reasons to believe that the success factors of the two groups are identical. Grouping the two groups also raises questions on measuring the system success. The benefits from utilizing the systems may not be commonly distributed to the two groups. One group's benefits might be realized at the expenses of the other group considering the situation where vendors participating in SCM systems are under continuous pressures from the focus companies with respect to prices, quality, and delivery time. Therefore, by combining the system outcomes of both groups we cannot measure the system benefits obtained by each group correctly. Second, the measures of system success adopted in the previous researches have shortcoming in measuring the SCM success. User satisfaction, system utilization, and user attitudes toward the systems are most commonly used success measures in the existing studies. These measures have been developed as proxy variables in the studies of decision support systems (DSS) where the contribution of the systems to the organization performance is very difficult to measure. Unlike the DSS, the SCM systems have more specific goals, such as cost saving, inventory reduction, quality improvement, rapid time, and higher customer service. We maintain that more specific measures can be developed instead of proxy variables in order to measure the system benefits correctly. The purpose of this study is to find the determinants of SCM systems success in the perspective of vendor companies. In developing the research model, we have focused on selecting the success factors appropriate for the vendors through reviewing past researches and on developing more accurate success measures. The variables can be classified into following: technological, organizational, and environmental factors on the basis of TOE (Technology-Organization-Environment) framework. The model consists of three independent variables (competition intensity, top management support, and information system maturity), one mediating variable (collaboration), one moderating variable (government support), and a dependent variable (system success). The systems success measures have been developed to reflect the operational benefits of the SCM systems; improvement in planning and analysis capabilities, faster throughput, cost reduction, task integration, and improved product and customer service. The model has been validated using the survey data collected from 122 vendors participating in the SCM systems in Korea. To test for mediation, one should estimate the hierarchical regression analysis on the collaboration. And moderating effect analysis should estimate the moderated multiple regression, examines the effect of the government support. The result shows that information system maturity and top management support are the most important determinants of SCM system success. Supply chain technologies that standardize data formats and enhance information sharing may be adopted by supply chain leader organization because of the influence of focal company in the private industrial networks in order to streamline transactions and improve inter-organization communication. Specially, the need to develop and sustain an information system maturity will provide the focus and purpose to successfully overcome information system obstacles and resistance to innovation diffusion within the supply chain network organization. The support of top management will help focus efforts toward the realization of inter-organizational benefits and lend credibility to functional managers responsible for its implementation. The active involvement, vision, and direction of high level executives provide the impetus needed to sustain the implementation of SCM. The quality of collaboration relationships also is positively related to outcome variable. Collaboration variable is found to have a mediation effect between on influencing factors and implementation success. Higher levels of inter-organizational collaboration behaviors such as shared planning and flexibility in coordinating activities were found to be strongly linked to the vendors trust in the supply chain network. Government support moderates the effect of the IS maturity, competitive intensity, top management support on collaboration and implementation success of SCM. In general, the vendor companies face substantially greater risks in SCM implementation than the larger companies do because of severe constraints on financial and human resources and limited education on SCM systems. Besides resources, Vendors generally lack computer experience and do not have sufficient internal SCM expertise. For these reasons, government supports may establish requirements for firms doing business with the government or provide incentives to adopt, implementation SCM or practices. Government support provides significant improvements in implementation success of SCM when IS maturity, competitive intensity, top management support and collaboration are low. The environmental characteristic of competition intensity has no direct effect on vendor perspective of SCM system success. But, vendors facing above average competition intensity will have a greater need for changing technology. This suggests that companies trying to implement SCM systems should set up compatible supply chain networks and a high-quality collaboration relationship for implementation and performance.

공공 서비스 수출 플랫폼을 위한 온톨로지 모형 (An Ontology Model for Public Service Export Platform)

  • 이광원;박세권;류승완;신동천
    • 지능정보연구
    • /
    • 제20권1호
    • /
    • pp.149-161
    • /
    • 2014
  • 공공 서비스의 수출의 경우 수출 절차와 대상 선정에 따른 다양한 문제가 발생하며, 공공 서비스 수출 플랫폼은 이러한 문제점들을 해결하기 위하여 사용자 중심의 유연하고, 개방형 구조의 디지털 생태계를 조성할 수 있도록 구현되어야 한다. 또한 공공서비스의 수출은 다수의 이해당사자가 참여하고 여러 단계의 과정을 거쳐야 하므로 사용자의 이해 종류와 탐색 컨설팅 협상 계약 등 수출 프로세스 단계별로 맞춤형 플랫폼 서비스 제공이 필수적이다. 이를 위해서 플랫폼 구조는 도메인과 정보의 정의 및 공유는 물론 지식화를 지원할 수 있어야 한다. 본 논문에서는 공공서비스 수출을 지원하는 플랫폼을 위한 온톨로지 모형을 제안한다. 서비스 플랫폼의 핵심 엔진은 시뮬레이터 모듈이며 시뮬레이터 모듈에서는 온톨로지를 사용하여 수출 비즈니스의 여러 컨텍스트들을 파악하고 정의하여 다른 모듈들과 공유하게 된다. 온톨로지는 공유 어휘를 통하여 개념들과 그들 간의 관계를 표현할 수 있으므로 특정 영역에서 구조적인 틀을 개발하기 위한 메타 정보를 구성하는 효과적인 도구로 잘 알려져 있다. 공공서비스 수출 플랫폼을 위한 온톨로지는 서비스, 요구사항, 환경, 기업, 국가 등 5가지 카테고리로 구성되며 각각의 온톨로지는 요구분석과 사례 분석을 통하여 용어를 추출하고 온톨로지의 식별과 개념적 특성을 반영하는 구조로 설계한다. 서비스 온톨로지는 목적효과, 요구조건, 활동, 서비스 분류 등으로 구성되며, 요구사항 온톨로지는 비즈니스, 기술, 제약으로 구성 된다. 환경 온톨로지는 사용자, 요구조건, 활동으로, 기업 온톨로지는 활동, 조직, 전략, 마케팅, 시간으로 구성되며, 국가 온톨로지는 경제, 사회기반시설, 법, 제도, 관습, 인프라, 인구, 위치, 국가전략 등으로 구성된다. 수출 대상 서비스와 국가의 우선순위 리스트가 생성되면 갭(gap) 분석과 매칭 알고리즘 등의 시뮬레이터를 통하여 수출기업과 수출지원 프로그램과의 시스템적 연계가 이루어진다. 제안하는 온톨로지 모형 기반의 공공서비스 수출지원 플랫폼이 구현되면 이해당사자 모두에게 도움이 되며 특히 정보 인프라와 수출경험이 부족한 중소기업에게 상대적으로 더 큰 도움이 될 것이다. 또한 개방형 디지털 생태계를 통하여 이해당사자들이 정보교환, 협업, 신사업 기획 등의 기회를 만들 수 있을 것으로 기대한다.

ICT 기반 다중 가치사슬의 동적 플랫폼에서의 공존 모형: 의료서비스를 중심으로 (A Coexistence Model in a Dynamic Platform with ICT-based Multi-Value Chains: focusing on Healthcare Service)

  • 이현정;장용식
    • 지능정보연구
    • /
    • 제23권1호
    • /
    • pp.69-93
    • /
    • 2017
  • ICT는 제조기반 산업사회에서 가치사슬의 효율성/효과성의 지원을 목적으로 도입되었으나 정보기반 산업사회에서는 ICT가 시장 가치 창출의 주체가 되어 다중 가치사슬의 형성 가능성을 기대하게 하였다. 즉, ICT의 발전은 공급 및 수요의 다변화와 다양성의 동인이 되면서 가치를 창출하기 시작했고, 이를 중심으로 하는 신 가치 사슬의 등장은 구 가치사슬과의 충돌의 문제를 야기하였다. 즉, 다중 가치사슬이 존재 가능한 플랫폼에서는 가치사슬 간의 충돌, 중첩, 생성, 상실 등의 동적 상황 등에 따른 신/구 가치의 창출과 소멸 등이 발생하게 된다. 예를 들어, ICT에 기반을 둔 우버택시 서비스는 신 가치사슬을 형성하여 택시서비스 시장에서 신/구 가치사슬간의 충돌을 야기했다. 제조기반 산업사회에서는 단일 가치사슬의 시장 선점이 중요하였으나, ICT 기반 융합 제품/서비스/정보가 유통되는 플랫폼에서는 시장 상황 변수의 동적 변화에 따라 다중의 가치사슬이 존재하면서 서로 충돌과 공존을 야기하게 되었다. 따라서 ICT에 기반을 둔 지능형 정보사회의 발전과 함께 시장가치 최대화를 위해 다중 가치사슬 간 충돌 최소화와 공존의 최대 가능성을 높일 수 있는 모형의 제시가 중요하다. 본 연구에서는 먼저 의료서비스 시장을 중심으로 하는 다중 가치사슬의 동적 플랫폼 형성에 대해 논의한다. 즉, 의료서비스 시장에 ICT 기반 원격 및 지능형 의료서비스 등이 구 시장에 진입함으로써 발생하는 가치사슬 간의 충돌을 최소화하고 공존 가능성을 높이기 위한 공존 요인 변수에 대해 논의 한다. 이를 위해 다중의 공급과 소비 및 서비스가 존재 가능한 다중 가치사슬이 충돌 및 중첩하는 과정에서 공존 요인 변수 등에 기반하여 가치 사슬들을 동적으로 생성/변화/소멸 및 공존하기까지 의료서비스 플랫폼에 대해 논의한다. 또한 플랫폼 내의 각 가치사슬의 생산가치의 증가와 가치사슬 간의 상호 작용에 의한 부가가치의 창출 등에 의해 플랫폼의 총 가치가 증가 될 수 있음을 논의한다. 마지막으로 공존 모형을 제안하고 실험을 통해 가치사슬 간의 공존 가능성을 제시한다.

키워드 자동 생성에 대한 새로운 접근법: 역 벡터공간모델을 이용한 키워드 할당 방법 (A New Approach to Automatic Keyword Generation Using Inverse Vector Space Model)

  • 조원진;노상규;윤지영;박진수
    • Asia pacific journal of information systems
    • /
    • 제21권1호
    • /
    • pp.103-122
    • /
    • 2011
  • Recently, numerous documents have been made available electronically. Internet search engines and digital libraries commonly return query results containing hundreds or even thousands of documents. In this situation, it is virtually impossible for users to examine complete documents to determine whether they might be useful for them. For this reason, some on-line documents are accompanied by a list of keywords specified by the authors in an effort to guide the users by facilitating the filtering process. In this way, a set of keywords is often considered a condensed version of the whole document and therefore plays an important role for document retrieval, Web page retrieval, document clustering, summarization, text mining, and so on. Since many academic journals ask the authors to provide a list of five or six keywords on the first page of an article, keywords are most familiar in the context of journal articles. However, many other types of documents could not benefit from the use of keywords, including Web pages, email messages, news reports, magazine articles, and business papers. Although the potential benefit is large, the implementation itself is the obstacle; manually assigning keywords to all documents is a daunting task, or even impractical in that it is extremely tedious and time-consuming requiring a certain level of domain knowledge. Therefore, it is highly desirable to automate the keyword generation process. There are mainly two approaches to achieving this aim: keyword assignment approach and keyword extraction approach. Both approaches use machine learning methods and require, for training purposes, a set of documents with keywords already attached. In the former approach, there is a given set of vocabulary, and the aim is to match them to the texts. In other words, the keywords assignment approach seeks to select the words from a controlled vocabulary that best describes a document. Although this approach is domain dependent and is not easy to transfer and expand, it can generate implicit keywords that do not appear in a document. On the other hand, in the latter approach, the aim is to extract keywords with respect to their relevance in the text without prior vocabulary. In this approach, automatic keyword generation is treated as a classification task, and keywords are commonly extracted based on supervised learning techniques. Thus, keyword extraction algorithms classify candidate keywords in a document into positive or negative examples. Several systems such as Extractor and Kea were developed using keyword extraction approach. Most indicative words in a document are selected as keywords for that document and as a result, keywords extraction is limited to terms that appear in the document. Therefore, keywords extraction cannot generate implicit keywords that are not included in a document. According to the experiment results of Turney, about 64% to 90% of keywords assigned by the authors can be found in the full text of an article. Inversely, it also means that 10% to 36% of the keywords assigned by the authors do not appear in the article, which cannot be generated through keyword extraction algorithms. Our preliminary experiment result also shows that 37% of keywords assigned by the authors are not included in the full text. This is the reason why we have decided to adopt the keyword assignment approach. In this paper, we propose a new approach for automatic keyword assignment namely IVSM(Inverse Vector Space Model). The model is based on a vector space model. which is a conventional information retrieval model that represents documents and queries by vectors in a multidimensional space. IVSM generates an appropriate keyword set for a specific document by measuring the distance between the document and the keyword sets. The keyword assignment process of IVSM is as follows: (1) calculating the vector length of each keyword set based on each keyword weight; (2) preprocessing and parsing a target document that does not have keywords; (3) calculating the vector length of the target document based on the term frequency; (4) measuring the cosine similarity between each keyword set and the target document; and (5) generating keywords that have high similarity scores. Two keyword generation systems were implemented applying IVSM: IVSM system for Web-based community service and stand-alone IVSM system. Firstly, the IVSM system is implemented in a community service for sharing knowledge and opinions on current trends such as fashion, movies, social problems, and health information. The stand-alone IVSM system is dedicated to generating keywords for academic papers, and, indeed, it has been tested through a number of academic papers including those published by the Korean Association of Shipping and Logistics, the Korea Research Academy of Distribution Information, the Korea Logistics Society, the Korea Logistics Research Association, and the Korea Port Economic Association. We measured the performance of IVSM by the number of matches between the IVSM-generated keywords and the author-assigned keywords. According to our experiment, the precisions of IVSM applied to Web-based community service and academic journals were 0.75 and 0.71, respectively. The performance of both systems is much better than that of baseline systems that generate keywords based on simple probability. Also, IVSM shows comparable performance to Extractor that is a representative system of keyword extraction approach developed by Turney. As electronic documents increase, we expect that IVSM proposed in this paper can be applied to many electronic documents in Web-based community and digital library.

폭소노미 사이트를 위한 랭킹 프레임워크 설계: 시맨틱 그래프기반 접근 (A Folksonomy Ranking Framework: A Semantic Graph-based Approach)

  • 박현정;노상규
    • Asia pacific journal of information systems
    • /
    • 제21권2호
    • /
    • pp.89-116
    • /
    • 2011
  • In collaborative tagging systems such as Delicious.com and Flickr.com, users assign keywords or tags to their uploaded resources, such as bookmarks and pictures, for their future use or sharing purposes. The collection of resources and tags generated by a user is called a personomy, and the collection of all personomies constitutes the folksonomy. The most significant need of the folksonomy users Is to efficiently find useful resources or experts on specific topics. An excellent ranking algorithm would assign higher ranking to more useful resources or experts. What resources are considered useful In a folksonomic system? Does a standard superior to frequency or freshness exist? The resource recommended by more users with mere expertise should be worthy of attention. This ranking paradigm can be implemented through a graph-based ranking algorithm. Two well-known representatives of such a paradigm are Page Rank by Google and HITS(Hypertext Induced Topic Selection) by Kleinberg. Both Page Rank and HITS assign a higher evaluation score to pages linked to more higher-scored pages. HITS differs from PageRank in that it utilizes two kinds of scores: authority and hub scores. The ranking objects of these pages are limited to Web pages, whereas the ranking objects of a folksonomic system are somewhat heterogeneous(i.e., users, resources, and tags). Therefore, uniform application of the voting notion of PageRank and HITS based on the links to a folksonomy would be unreasonable, In a folksonomic system, each link corresponding to a property can have an opposite direction, depending on whether the property is an active or a passive voice. The current research stems from the Idea that a graph-based ranking algorithm could be applied to the folksonomic system using the concept of mutual Interactions between entitles, rather than the voting notion of PageRank or HITS. The concept of mutual interactions, proposed for ranking the Semantic Web resources, enables the calculation of importance scores of various resources unaffected by link directions. The weights of a property representing the mutual interaction between classes are assigned depending on the relative significance of the property to the resource importance of each class. This class-oriented approach is based on the fact that, in the Semantic Web, there are many heterogeneous classes; thus, applying a different appraisal standard for each class is more reasonable. This is similar to the evaluation method of humans, where different items are assigned specific weights, which are then summed up to determine the weighted average. We can check for missing properties more easily with this approach than with other predicate-oriented approaches. A user of a tagging system usually assigns more than one tags to the same resource, and there can be more than one tags with the same subjectivity and objectivity. In the case that many users assign similar tags to the same resource, grading the users differently depending on the assignment order becomes necessary. This idea comes from the studies in psychology wherein expertise involves the ability to select the most relevant information for achieving a goal. An expert should be someone who not only has a large collection of documents annotated with a particular tag, but also tends to add documents of high quality to his/her collections. Such documents are identified by the number, as well as the expertise, of users who have the same documents in their collections. In other words, there is a relationship of mutual reinforcement between the expertise of a user and the quality of a document. In addition, there is a need to rank entities related more closely to a certain entity. Considering the property of social media that ensures the popularity of a topic is temporary, recent data should have more weight than old data. We propose a comprehensive folksonomy ranking framework in which all these considerations are dealt with and that can be easily customized to each folksonomy site for ranking purposes. To examine the validity of our ranking algorithm and show the mechanism of adjusting property, time, and expertise weights, we first use a dataset designed for analyzing the effect of each ranking factor independently. We then show the ranking results of a real folksonomy site, with the ranking factors combined. Because the ground truth of a given dataset is not known when it comes to ranking, we inject simulated data whose ranking results can be predicted into the real dataset and compare the ranking results of our algorithm with that of a previous HITS-based algorithm. Our semantic ranking algorithm based on the concept of mutual interaction seems to be preferable to the HITS-based algorithm as a flexible folksonomy ranking framework. Some concrete points of difference are as follows. First, with the time concept applied to the property weights, our algorithm shows superior performance in lowering the scores of older data and raising the scores of newer data. Second, applying the time concept to the expertise weights, as well as to the property weights, our algorithm controls the conflicting influence of expertise weights and enhances overall consistency of time-valued ranking. The expertise weights of the previous study can act as an obstacle to the time-valued ranking because the number of followers increases as time goes on. Third, many new properties and classes can be included in our framework. The previous HITS-based algorithm, based on the voting notion, loses ground in the situation where the domain consists of more than two classes, or where other important properties, such as "sent through twitter" or "registered as a friend," are added to the domain. Forth, there is a big difference in the calculation time and memory use between the two kinds of algorithms. While the matrix multiplication of two matrices, has to be executed twice for the previous HITS-based algorithm, this is unnecessary with our algorithm. In our ranking framework, various folksonomy ranking policies can be expressed with the ranking factors combined and our approach can work, even if the folksonomy site is not implemented with Semantic Web languages. Above all, the time weight proposed in this paper will be applicable to various domains, including social media, where time value is considered important.

소셜 네트워크 분석 기법을 활용한 협업필터링의 특이취향 사용자(Gray Sheep) 문제 해결 (Resolving the 'Gray sheep' Problem Using Social Network Analysis (SNA) in Collaborative Filtering (CF) Recommender Systems)

  • 김민성;임일
    • 지능정보연구
    • /
    • 제20권2호
    • /
    • pp.137-148
    • /
    • 2014
  • 상품 검색시간의 단축과 쇼핑에 투입되는 노력의 감소 등, 온라인 쇼핑이 주는 장점에 대한 긍정적인 인식이 확산되면서 전자상거래(e-commerce)의 중요성이 부각되는 추세이다. 전자상거래 기업들은 고객확보를 위해 다양한 인터넷 고객관계 관리(eCRM) 활동을 전개하고 있는데, 개인화된 추천 서비스의 제공은 그 중 하나이다. 정확한 추천 시스템의 구축은 전자상거래 기업의 성과를 좌우하는 중요한 요소이기 때문에, 추천 서비스의 정확도를 높이기 위한 다양한 알고리즘들이 연구되어 왔다. 특히 협업필터링(collaborative filtering: CF)은 가장 성공적인 추천기법으로 알려져 있다. 그러나 고객이 상품을 구매한 과거의 전자상거래 기록을 바탕으로 미래의 추천을 하기 때문에 많은 단점들이 존재한다. 신규 고객의 경우 유사한 구매 성향을 가진 고객들을 찾기 어렵고 (Cold-Start problem), 상품 수에 비해 구매기록이 부족할 경우 상관관계를 도출할 데이터가 희박하게 되어(Sparsity) 추천성능이 떨어지게 된다. 취향이 독특한 사용자를 뜻하는 'Gray Sheep'에 의한 추천성능의 저하도 그 중 하나이다. 이러한 문제인식을 토대로, 본 연구에서는 소셜 네트워크 분석기법 (Social Network Analysis: SNA)과 협업필터링을 결합하여 데이터셋의 특이 취향 사용자 (Gray Sheep) 문제를 해소하는 방법을 제시한다. 취향이 독특한 고객들의 구매데이터를 소셜 네트워크 분석지표를 활용하여 전체 데이터에서 분리해낸다. 그리고 분리한 데이터와 나머지 데이터인 두 가지 데이터셋에 대하여 각기 다른 유사도 기법과 트레이닝 셋을 적용한다. 이러한 방법을 사용한 추천성능의 향상을 검증하기 위하여 미국 미네소타 대학 GroupLens 연구팀에 의해 수집된 무비렌즈 데이터(http://movielens.org)를 활용하였다. 검증결과, 일반적인 협업필터링 추천시스템에 비하여 이 기법을 활용한 협업필터링의 추천성능이 향상됨을 확인하였다.