• 제목/요약/키워드: F-Measure

검색결과 1,400건 처리시간 0.033초

사용자 청취 습관과 태그 정보를 이용한 하이브리드 음악 추천 시스템 (A Hybrid Music Recommendation System Combining Listening Habits and Tag Information)

  • 김현희;김동건;조진남
    • 한국컴퓨터정보학회논문지
    • /
    • 제18권2호
    • /
    • pp.107-116
    • /
    • 2013
  • 본 연구에서는 소셜 음악 사이트에서 사용자들이 음악 아이템을 청취한 횟수와 생성한 태그 정보를 혼합하여 음악을 추천하는 시스템을 제안한다. 현재, 상용화된 음악 추천 시스템들은 주로 사용자의 청취 습관과 외부적인 선호도 입력값을 기반으로 음악을 추천하고 있다. 그러나 이 방식은 아직 음악을 청취한 사용자가 많지 않은 새로운 음악이나 청취 정보가 없는 새로운 사용자의 경우 추천하는 데 어려움이 있다. 이 문제를 해결하기 위해서 본 논문에서는 사용자가 선정한 키워드를 아이템에 부여하는 협업 태깅으로 생성된 태그 정보를 활용하였다. 태그의 의미를 파악하여 감정 표현의 정도에 따라 가중치를 부여한 뒤, 태그 점수와 청취 횟수를 혼합하여 음악 아이템의 선호도를 산출하였다. 이를 기반으로 사용자 프로파일을 생성하고 협업 필터링 알고리즘을 수행하였다. 제안하는 추천 방법의 효율성을 평가하기 위해서, 청취 습관 기반 추천, 태그 점수 기반 추천, 하이브리드 추천 방법의 세 가지 추천 방법에 대해서 정확도, 재현율, 그리고 F-measure를 계산하였다. 실험 결과에 대해 통계적 검증을 시행한 결과, 하이브리드 추천 방법이 다른 두 가지 방식보다 통계적으로 유의한 차이를 보여 성능이 우수한 것으로 나타났다.

국내 학술논문의 동명이인 저자명 식별을 위한 방법 (A Method for Same Author Name Disambiguation in Domestic Academic Papers)

  • 신다예;양기덕
    • 한국비블리아학회지
    • /
    • 제28권4호
    • /
    • pp.301-319
    • /
    • 2017
  • 저자명 식별이란 다른 이름으로 표기된 한 명의 개인을 식별하는 것과 같은 이름을 가진 서로 다른 저자들을 각기 구별된 개인으로 분류하는 것으로, 저자의 연구 목록 및 연구 업적 평가, 특정 분야의 전문가를 검색하거나, 인용색인과 같은 학술 정보 서비스의 원활한 운영을 위해 반드시 해결해야 할 문제이다. 본 연구는 단순 머신러닝만을 사용한 실험 결과와 휴리스틱 방식으로 데이터 셋의 오류 수정 및 정규화 작업을 이후 머신러닝의 처리 과정에 룰 베이스 기반의 규칙을 부여한 저자명 식별 실험의 결과의 비교를 통하여, 인간의 개입이 머신러닝의 단점을 보완하고 저자명 식별 성능을 향상시킬 수 있는지 알아보았다. 그 결과 F-measure 0.1 이상 향상시킨 정규화 된 email기반의 룰 베이스 저자식별 결과로 정규화 과정과 휴리스틱 설정에 필요한 인간의 패턴인식과 추론능력이 머신러닝의 단점을 보완해줄 수 있음에 대한 가능성을 나타내었다.

한국어 Hedge 문장 인식을 위한 태깅 말뭉치 및 단서어구 패턴 구축 (Constructing Tagged Corpus and Cue Word Patterns for Detecting Korean Hedge Sentences)

  • 정주석;김준혁;김해일;오성호;강신재
    • 한국지능시스템학회논문지
    • /
    • 제21권6호
    • /
    • pp.761-766
    • /
    • 2011
  • Hedge는 불확실함을 나타내는 언어적 표현으로, 저자가 자신의 글에 내포된 내용이 불확실하거나 의심이 갈 때 사용한다. 이러한 불확실성 때문에 hedge가 포함된 문장은 사실이 아닌 문장으로 간주된다. 문장이 사실인지 아닌지를 판단하는 것은 여러 응용에서 사용될 수 있는데, 정보검색, 정보추출, 질의응답 등의 응용분야에서 전처리 과정으로 사용되어, 보다 정확한 결과를 얻게 한다. 본 논문에서는 한국어 hedge 말뭉치를 구축하고, 이로부터 hedge 단서 어구들을 추출하여 일반화된 단서어구 패턴을 구축한 후, 한국어 hedge 인식 실험을 하였다. 실험을 통하여 78.6%의 F1-measure값을 얻을 수 있었다.

데이터 구조를 고려한 소스코드 표절 검사 기법 (A Plagiarism Detection Technique for Source Codes Considering Data Structures)

  • 이기화;김연어;우균
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제3권6호
    • /
    • pp.189-196
    • /
    • 2014
  • 표절은 불법이고 피해야 하지만 여전히 빈번하게 발생하고 있다. 특히, 소스코드 표절은 그 특성상 복사가 용이해 다른 저작물보다 더 빈번히 발생한다. 코드 표절을 방지하기 위한 다양한 연구가 있었다. 하지만 앞서 연구된 소스코드 표절 검사 기법을 살펴보면 프로그램이 알고리즘과 데이터 구조로 구성됨에도 불구하고 데이터 구조는 전혀 고려하지 않고 있다. 이 논문에서는 데이터 구조를 고려한 소스코드 표절 검사 기법을 제안한다. 구체적으로 말해서 두 소스코드의 데이터 구조를 트리 집합으로 나타내고, 헝가리안 메소드를 사용해 비교한다. 제안하는 기법의 효용성을 보이기 위해 객체지향 교과목에서 과제 답안으로 제출한 126개의 소스코드를 대상으로 실험하였다. 실험 결과 데이터 구조와 알고리즘을 모두 고려했을 때, 알고리즘만 고려한 경우보다 정확률과 F-measure가 각각 22.6%, 19.3% 향상됨을 보였다.

유사어 사전을 이용한 웹기반 질의문의 자동 범주화에 관한 연구 (A Study on Automatic Text Categorization of Web-Based Query Using Synonymy List)

  • 남영준;김규환
    • 정보관리연구
    • /
    • 제35권4호
    • /
    • pp.81-105
    • /
    • 2004
  • 본 연구에서는 웹기반 질의문을 자동 범주화하는 방안에 대해 조사하였다. 질의문 범주화에 대한 실험은 SVM-light를 사용하여 범주자질로써 유사어 사전을 부여하기 전과 후를 비교하였다. 유사어는 학습을 통해 수작업으로 대상문서에서 713개를 추출하였다. 전체적으로 유사어 부여전과 부여후의 결과는 6개 범주에서 정도율은 -0.01%로 거의 변화가 없었으며 재현율은 8.53%가 향상되었다. F1-Measure 값도 4.58%가 향상되었다. 특히 범주내 정도율과 재현율의 표준편차가 18.39%나 개선되어 적정한 검색효율을 확보할 수 있었다.

영적간호중재가 말기암환자의 삶의 의미와 영적고통에 미치는 효과

  • 윤매옥
    • 호스피스학술지
    • /
    • 제5권2호
    • /
    • pp.64-74
    • /
    • 2005
  • Purpose : This study is non-equivalent control group pre-post design attempted to see 'The effect of spiritual nursing intervention on the meaning of life and spiritual distress of the terminal cancer patients.' Method : The data collection was performed from June to October, 2004. The subjects were 41 terminal cancer patients of one general hospital in Jeon Ju city. They are formed two groups, 20 experimental group and 21 control group. Experimental treatment provided spiritual nursing intervention 3 times per a week, the mean 45 minutes each, for 4 weeks for experimental group with the contents of therapeutical use of oneself, use of bible, use of hymn, use of prayer, depend on the priest in the spiritual need assessment of 6 kinds. Study tools was used the thing which Kim(1990) developed about purpose inspection of life which Crumbaugh(1968) developed to measure the meaning of life. The measure of spiritual distress was used the tool which Kim(1990) developed, spiritual nursing intervention was developed by researcher of this thesis. Data was analyzed by descriptive statistics of real number, percentage, the mean etc. and x2-test, t-test, ANCOVA. Result: The 1st hypothesis, 'spiritual the meaning of life score in the experimental group, who received the spiritual nursing intervention, will be higher than the control group who did not receive it' was supported(F=157.09, P=0.000) The 2nd hypothesis, 'spiritual distress score in the experimental group, who received the spiritual nursing intervention, will be lower than the control group who did not receive it' was supported(F=36.48, P=0.000) Conclusion: Spiritual nursing intervention was verified as an effective program to improve the meaning of life and decrease spiritual distress for the terminal cancer patients. Thus, it was confirmed with an effective nursing intervention which helps them in order to spend the rest time of life meaningfully and meet the peaceful death.

  • PDF

대규모 범죄 수사기록을 활용한 온톨로지 기반 서비스 구현 - 침입 절도 범죄 분야를 중심으로 - (Implementation of Ontology-based Service by Exploiting Massive Crime Investigation Records: Focusing on Intrusion Theft)

  • 고건우;김선우;박성진;노윤주;최성필
    • 한국문헌정보학회지
    • /
    • 제53권1호
    • /
    • pp.57-81
    • /
    • 2019
  • 온톨로지는 특정 분야의 특정 지식과 관련된 용어 및 용어 사이의 관계를 정의하는 복합 구조 사전이다. 국내외로 다양한 온톨로지 구축의 시도가 있었으나 대규모의 범죄 수사기록을 온톨로지로 구축하고 이를 통한 서비스를 구현한 사례는 존재하지 않았다. 따라서 본 논문은 비정형 데이터인 범죄 수사기록 문서 중 침입 절도 분야로부터 추출한 정보를 통해 온톨로지를 구축하고, 온톨로지 기반의 검색 서비스와 범행 장소 추천 서비스를 구현하는 과정을 설명한다. 검색 서비스의 성능을 파악하기 위하여 사건 검색에 대한 정확도 측정 방법 중 하나인 Top-K 방식의 정확도 측정을 실험하였고, 실험 집합에 대하여 최대 93.52%의 정확도를 얻었다. 또한, 범행 장소 추천 서비스의 성능을 파악하기 위한 실험 결과, 실험 데이터셋의 전체에 대해 적합한 단서 필드 조합을 얻어냈으며, F1-measure 76.19%의 성능으로 데이터베이스 내의 범행 장소 필드 정보를 교정할 수 있음을 확인하였다.

다중상황의 군집분석과 연관규칙을 이용한 지식추론 모델 (Knowledge Reasoning Model using Association Rules and Clustering Analysis of Multi-Context)

  • 신동훈;김민정;오상엽;정경용
    • 한국융합학회논문지
    • /
    • 제10권9호
    • /
    • pp.11-16
    • /
    • 2019
  • 사람들은 바쁜 현대사회 속에서 시간적 제재를 받고 있다. 이에 따라 사람들은 건강에 나쁜 영향을 미치는 간편한 인스턴트 식품을 섭취하고 간단한 운동조차하기 어려운 상황에 놓여있다. 또한 불필요한 정보과부화 현상으로 인해 개인의 특성에 적합하고 정확한 추론을 하는 것에 대한 중요성이 커지고 있다. 따라서 본 논문에서는 다중상황의 군집분석과 연관규칙을 이용한 지식추론 모델을 제안한다. 제안하는 방법은 상황정보에 따른 군집을 기반으로 연관규칙을 생성함으로써 사용자들에게 개인화된 헬스케어 방법을 제공한다. 이를 통해 각 질병에 대한 위험도를 추론함으로써 해당 질병에 대한 발병률을 낮출 수 있다. 또한 성능 평가를 통해 제안하는 모델이 비교 모델보다 수치상으로 F-measure 값이 0.027 더 높게 나타나며, 비교 모델 보다 우수하게 평가된다.

Verification of Reproducibility of VCS2000 Equipment for Mechanical Measurement of Korean Landrace×Yorkshire (F1), F1×Duroc (LYD) Pig Carcasses

  • Yunhwan Park;Kwantae Kim;Jaeyoung Kim;Jongtae Seo;Jungseok Choi
    • 한국축산식품학회지
    • /
    • 제43권4호
    • /
    • pp.553-562
    • /
    • 2023
  • With an increase in meat consumption, the need to measure the weight of each primal cut of pork has increased. Recently, automation devices have been used to measure the weight of each primal cut of pork. The objective of this study was to investigate the accuracy of VCS2000, one of the non-invasive pig carcass analyzers. Production levels of 7 primal cuts of 50 pigs were measured with VCS2000. Average error rates between dissected value for each primal cut and VCS2000 measurement values of ham, shoulder picnic, belly, loin, and shoulder blade were around 5%. Average error rates for spare rib and tenderloin were about 10%. Correlation coefficients between the dissected value and the VCS2000 measured value for ham, shoulder picnic, loin, belly, and shoulder blade were high at 0.66-0.83. Correlation coefficients of spare rib and tenderloin were low at 0.35 and 0.47. Coefficient of determination of the VCS2000 measured value for each primal cut by regression analysis was 0.77 or more for ham, shoulder picnic, loin, and shoulder blade and 0.63 for belly. Coefficients of determination for spare rib and tenderloin were low at 0.40 and 0.27. In addition, the coefficient of determination of VCS2000 for each primal cut was higher than that of the dissected value for all primal cuts. In conclusion, pig carcass analysis using the VCS2000 has a high reliability for pork cuts with high production levels, but a relatively low reliability for pork cuts with low production levels and high fat levels.

다양한 사람 종양세포주에서 F-18-FDG의 섭취와 Hexokinase 활성 및 Glut-1 발현과의 상관관계 (The Relationship between F-18-FDG Uptake, Hexokinase Activity and Glut-1 Expression in Various Human Cancer Cell Lines)

  • 김보광;정준기;이용진;최용운;정재민;이동수;이명철
    • 대한핵의학회지
    • /
    • 제34권4호
    • /
    • pp.294-302
    • /
    • 2000
  • 목적: 종양세포에서 F-18-FDG 섭취 기전을 규명하기 위하여 F-18-FDG 섭취와 포도당운반체-1 (Glut-1), hexokinase의 발현과의 상관관계를 조사하였다. 대상 및 방법: 사람의 대장암(SNU-C2A, SNU-C4, SNU-C5), 간암(SNU-387, SNU-423, SNU-449), 폐암(NCI-H522, NCI-H358, NCI-H1299), 자궁경부암(HeLa, HeLa 229, HeLa S3), 그리고 뇌암(A172, Hs 683)에서 기원한 암 세포주 $5{\times}10^5$ 세포를 24 well plate에 24시간 배양하였다. 여기에 37 kBq의 F-18-FDG를 첨가한 후 각 세포의 섭취 정도를 감마 카운터를 사용하여 측정하였다. Hexokinase의 활성은 분광광도계를 사용하여 측정하였다. 디토콘드리아에서의 hexokinase 활성은 고속원심분리기를 이용하여 미토콘드리아 분획을 분리하여 조사하였다. Glut-1의 발현은 면역조직염색법으로 측정하였다. 결과: 종양세포의 종류에 따라 F-18-FDG 섭취, 전체 그리고 미토콘드리아 hexokinase 활성, 그리고 Glut-1의 발현 정도에 차이가 있었다. 종양세포주에서 F-18-FDG 섭취와 세포전체, 세포내 미토콘드리아 hexokinase 활성과의 상관관계(각각 r=0.27, r=0.26)는 낮게 나타났으며, Glut-1의 발현은 F-18-FDG의 섭취와 상관관계(p=0.81, p=0.0015)가 높았다. 대장암 세포주에서 F-18-FDG 섭취와 hexokinase 활성의 상관관계가 없다는 보고를 토대로 대장암 세포주 결과를 제외했을 경우에 F-18-FDG의 섭취와 세포전체 그리고 세포내 미토콘드리아에서의 hexokinase 활성과는 높은 상관관계(각각 r=0.81, p=0.0027, 그리고 r=0.81, p=0.0049)를 보였다. 결론: Glut-1이나 hexokinase 활성이 사람 종양 세포주에서 F-18-FDG의 섭취를 결정하는 주 요인이며, 종양세포의 종류에 따라 이들의 기여도는 서로 다름을 알 수 있었다.

  • PDF