• 제목/요약/키워드: feature ranking

검색결과 48건 처리시간 0.031초

영상 특징들에 자동 가중치 부여를 이용한 검색 성능 개선 (Improvement of Retrieval Performance using Automatically Weighted Image Features)

  • 김강욱;박종호;황창식
    • 대한전자공학회논문지SP
    • /
    • 제37권6호
    • /
    • pp.17-21
    • /
    • 2000
  • 내용기반 영상 검색에서는 컬러, 형태, 질감의 세 가지 대표적인 영상 특징들이 주로 사용된다. 한 가지 특징만을 사용하는 검색 방법은 영상의 내용이 복잡하거나 비교대상이 되는 영상의 수가 많아질수록 좋은 성능을 보이지 못한다. 그래서 여러 가지 영상 특징들을 결합한 방법들이 많이 연구되고 있다. 그러나 여러 특징들을 결합해서 사용하는 검색 시스템이라 할지라도 각 특징들에 대한 가중치가 적합하게 부여되지 않으면 검색되는 결과 영상들의 순위가 크게 변하여 검색 성능이 떨어지게 된다. 이러한 문제점을 해결하기 위해 본 논문에서는 여러 영상 특징들이 결합해서 사용될 때 각 특징에 대한 가중치를 자동적으로 부여해서 검색 성능을 개선하고자 한다. 제안한 방법을 992개의 테스트 영상들로 구성된 데이터 베이스에서 실험을 하고 다양한 성능평가 방법을 통해 그 타당성을 확인하였으며 제안한 방법을 고정가중치 부여를 이용한 방법과 비교하여 검색 성능이 개선됨을 볼 수 있었다.

  • PDF

딥러닝을 이용한 강좌 추천시스템 (Course recommendation system using deep learning)

  • 임민아;황승연;신동진;오재곤;김정준
    • 한국인터넷방송통신학회논문지
    • /
    • 제23권3호
    • /
    • pp.193-198
    • /
    • 2023
  • 딥러닝을 이용한 학습자 맞춤 강의 추천 프로젝트를 연구한다. 추천시스템은 웹과 앱에서 쉽게 발견할 수 있으며 이 특성을 이용한 예제는 사용자 클릭으로 특성 영상 추천과 SNS에서 평소 사용자가 관심 있던 분야의 아이템을 광고하는 것이 있다. 본 연구에서는 문장 유사도인 Word2Vec를 주로 이용하여 2번의 필터링을 거쳤으며 Surprise 라이브러리를 통해 강좌 추천을 하였다. 이러한 시스템으로 사용자에게 간편하고 편리하게 원하는 분류의 강좌 데이터를 제공한다. Surprise 라이브러리는 Python scikit-learn 기반의 라이브러리이며 추천시스템에 편리하게 사용된다. 데이터를 분석하여 시스템을 빠른 속도로 구현하고 딥러닝을 사용하여 강좌 단계를 거쳐 보다 더 정밀한 결과를 구현해낸다. 사용자가 관심 있는 키워드를 입력하면 해당 키워드와 강좌 제목과의 유사도를 실행하고 추출된 영상 데이터로 또 음성 텍스트와의 유사도를 실행하여 추출된 데이터로 Surprise 라이브러리를 통해 가장 높은 순위의 영상 데이터를 추천한다.

베이지안 SOM과 붓스트랩을 이용한 문서 군집화에 의한 문서 순위조정 (A Document Ranking Method by Document Clustering Using Bayesian SoM and Botstrap)

  • 최준혁;전성해;이정현
    • 한국정보처리학회논문지
    • /
    • 제7권7호
    • /
    • pp.2108-2115
    • /
    • 2000
  • The conventional Boolean retrieval systems based on vector spae model can provide the results of retrieval fast, they can't reflect exactly user's retrieval purpose including semantic information. Consequently, the results of retrieval process are very different from those users expected. This fact forces users to waste much time for finding expected documents among retrieved documents. In his paper, we designed a bayesian SOM(Self-Organizing feature Maps) in combination with bayesian statistical method and Kohonen network as a kind of unsupervised learning, then perform classifying documents depending on the semantic similarity to user query in real time. If it is difficult to observe statistical characteristics as there are less than 30 documents for clustering, the number of documents must be increased to at least 50. Also, to give high rank to the documents which is most similar to user query semantically among generalized classifications for generalized clusters, we find the similarity by means of Kohonen centroid of each document classification and adjust the secondary rank depending on the similarity.

  • PDF

스마트 센서와 시각적 기술자를 결합한 사진 검색 시스템 (Photo Retrieval System using Combination of Smart Sensor and Visual Descriptor)

  • 이용환;김흥준
    • 반도체디스플레이기술학회지
    • /
    • 제13권2호
    • /
    • pp.45-52
    • /
    • 2014
  • This paper proposes an efficient photo retrieval system that automatically indexes for searching of relevant images, using a combination of geo-coded information, direction/location of image capture device and content-based visual features. A photo image is labeled with its GPS (Global Positioning System) coordinates and direction of the camera view at the moment of capture, and the label leads to generate a geo-spatial index with three core elements of latitude, longitude and viewing direction. Then, content-based visual features are extracted and combined with the geo-spatial information, for indexing and retrieving the photo images. For user's querying process, the proposed method adopts two steps as a progressive approach, filtering the relevant subset prior to use a content-based ranking function. To evaluate the performance of the proposed scheme, we assess the simulation performance in terms of average precision and F-score, using a natural photo collection. Comparing the proposed approach to retrieve using only visual features, an improvement of 20.8% was observed. The experimental results show that the proposed method exhibited a significant enhancement of around 7.2% in retrieval effectiveness, compared to previous work. These results reveal that a combination of context and content analysis is markedly more efficient and meaningful that using only visual feature for image search.

가상현실 기반 3차원 공간에 대한 감정분류 딥러닝 모델 (Emotion Classification DNN Model for Virtual Reality based 3D Space)

  • 명지연;전한종
    • 대한건축학회논문집:계획계
    • /
    • 제36권4호
    • /
    • pp.41-49
    • /
    • 2020
  • The purpose of this study was to investigate the use of the Deep Neural Networks(DNN) model to classify user's emotions, in particular Electroencephalography(EEG) toward Virtual-Reality(VR) based 3D design alternatives. Four different types of VR Space were constructed to measure a user's emotion and EEG was measured for each stimulus. In addition to the quantitative evaluation based on EEG data, a questionnaire was conducted to qualitatively check whether there is a difference between VR stimuli. As a result, there is a significant difference between plan types according to the normalized ranking method. Therefore, the value of the subjective questionnaire was used as labeling data and collected EEG data was used for a feature value in the DNN model. Google TensorFlow was used to build and train the model. The accuracy of the developed model was 98.9%, which is higher than in previous studies. This indicates that there is a possibility of VR and Fast Fourier Transform(FFT) processing would affect the accuracy of the model, which means that it is possible to classify a user's emotions toward VR based 3D design alternatives by measuring the EEG with this model.

온라인 뉴스와 거시경제 지표, 금융 지표, 기술적 지표, 관심도 지표를 이용한 코스닥 상장 기업의 기계학습 기반 주가 변동 예측 (Machine Learning Based Stock Price Fluctuation Prediction Models of KOSDAQ-listed Companies Using Online News, Macroeconomic Indicators, Financial Market Indicators, Technical Indicators, and Social Interest Indicators)

  • 김화련;홍승혜;홍헬렌
    • 한국멀티미디어학회논문지
    • /
    • 제24권3호
    • /
    • pp.448-459
    • /
    • 2021
  • In this paper, we propose a method of predicting the next-day stock price fluctuations of 10 KOSDAQ-listed companies in 5G, autonomous driving, and electricity sectors by training SVM, XGBoost, and LightGBM models from macroeconomic·financial market indicators, technical indicators, social interest indicators, and daily positive indices extracted from online news. In the three experiments to find out the usefulness of social interest indicators and daily positive indices, the average accuracy improved when each indicator and index was added to the models. In addition, when feature selection was performed to analyze the superiority of the extracted features, the average importance ranking of the social interest indicator and daily positive index was 5.45 and 1.08, respectively, it showed higher importance than the macroeconomic financial market indicators and technical indicators. With the results of these experiments, we confirmed the effectiveness of the social interest indicators as alternative data and the daily positive index for predicting stock price fluctuation.

산후조리원을 이용한 산모의 간호요구 및 만족도 (A Study on the Nursing Needs and Service Satisfactory of Users in the Post-Partum Care Center)

  • 정현
    • 여성건강간호학회지
    • /
    • 제5권2호
    • /
    • pp.222-229
    • /
    • 1999
  • These days, as the society has been in the trends of highly industrialized and the family has been downsized, there is remarkably increasing number of women who follow occupation. These changes have made it more difficult for the family to help post-partum mother, which had been performed in side of house. By the help of social believe that during at least 1 month after childbirth professional nursing program is indispensable for both maternity protection and physical-mental recuperation, now many post-partum care centers for post-partum mother have been in operation. Although these post-partum care center have in use for a long time, no study was performed before this study on the same subject. Data were analyzed using by SAS. The results of study are as follow : 1. The general features of the user of the post-partum care center. The predominant band of user's age is extended from 26 to 30. The users are mainly housewives and they are in higher level of incomes and educations. As for the feature of delivery methods, they performed the normal spontaneous vaginal delivery method by 58.0% and the Caesarean operation method by 42.0%. As for the sexuality for babies, 59.3% of infants are male, and 40.7% are female. The highest delivery order of users is first and admission after 1-3days delivery is highest. 2. The results for the investigation into the actual condition of the post-partum care center are as follow : About the main reason for entrance of the post-partum care center was found to be the needs for the better nursing programs for recuperation after childbirth. This demands are also supported by their husbands. The average length of stay in the post-partum care center is 17.6 days and the besides promised expense ; powdered milk, milk-suckers, disposable dippers, skin cares, body shape cares, entrophics, injections. The post-partum have private rooms for mother and infants. Over the half of average expense is 229 million won. They are paying accessory fees the post-partum care center have similar step organization : the nurses, the skin carers, the cleaners. Mostly both ways of feeding powdered milk and breast feeding are in use, and mother's milk is preserved in the night time to be given to infant by nurse in charge. 3. The results of the investigation on users' nursing demand to the post-partum care center and satisfaction are as follow : The ranking order of nursing demand of mothers who used the is that ; infant care demands, environmental demands, emotional and mental care demands, education and training demands. As much as 70% of the respondents have dissatisfaction in nursing program, The ranking order of service satisfaction of mothers who used appears to be higher following order ; satisfaction in infant care demand, satisfaction in physical nursing demand, satisfaction in emotional and mental nursing demand, satisfaction in education and training demand, satisfaction in environment nursing demand. The results of pearson correlation. between nursing demand and service satisfaction of mothers who used are found to be relative noticeable in the level of 0.05. only infant care. The 61.7% of the women who used the post-partum care center. are responding that they will reuse the same post-partum care center again.

  • PDF

기계학습에 기반한 생의학분야 전문용어의 자동인식 (Machine-Learning Based Biomedical Term Recognition)

  • 오종훈;최기선
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제33권8호
    • /
    • pp.718-729
    • /
    • 2006
  • 일정 분야의 문서들에서 그 분야 특정을 반영하는 전문용어를 자동으로 인식하는 연구에 대한 관심이 증가하고 있다. '전문용어 인식'은 문서에서 전문용어가 될 수 있는 언어적 단위를 파악하는 '용어 추출' 과정과 '용어추출' 과정에서 얻어진 용어목록 중 해당분야의 전문용어를 고르는 '전문용어 선택' 과정으로 구성된다. '전문용어 선택' 과정은 용어목록을 전문용어의 특정에 따라 순위화한 후 타당한 전문용어를 파악하는 작업으로 정의된다. 따라서 전문용어 선택 문제는 용어목록의 순위화 작업과 순위화된 목록에서 전문용어와 비전문용어 간의 경계를 인식하는 작업으로 정의된다. 기존의 전문용어 선택 기법은 주로 용어의 빈도수 등과 같은 통계적 특정만을 이용하였다. 하지만 통계적 특정만으로는 효과적으로 전문용어를 선택하기 어렵다. 본 논문의 논제는 전문용어 선택에서 다양한 전문용어의 특정을 고려하고 이들 중 전문용어 선택에서 효과적인 특정을 찾으려는 것이다. 순위화 문제는 다양한 전문용어 특정을 도출하고 이들을 기계학습방법으로 통합하여 해결한다. 경계인식 문제는 전문용어와 비전문용어의 이진 분류 문제로 정의하고 기계학습방법으로 해결한다. 본 논문의 기법은 경계인식측면에서 78-86%의 정확률과 87% -90%의 재현율을 나타내었으며, 순위화 측면에서 89%-92%의 11포인트 평균정확률을 나타내었다. 또한 기존 연구보다 최고 26% 의 성능향상을 보였다.

키 프레임 특징들에 적응적 가중치 부여를 이용한 검색 성능 개선 (Improvement of Retrieval Performance Using Adaptive Weighting of Key Frame Features)

  • 김강욱
    • 한국멀티미디어학회논문지
    • /
    • 제17권1호
    • /
    • pp.26-33
    • /
    • 2014
  • 비디오 검색 및 색인은 먼저 압축 비디오에서 장면전환을 검출하여 샷(shot)으로 분리한 후 샷 내에 키프레임 특징 정보들의 유사도 비교를 통해 이루어진다. 일반적으로 내용기반 영상 및 비디오 검색에서는 컬러, 형태, 질감의 세 가지 대표적인 영상 특징들이 주로 사용된다. 그러나 여러 특징들이 결합되어 사용되는 검색 시스템이라 할지라도 각 특징들에 대한 가중치가 적합하게 부여되지 않으면 검색되는 결과 영상의 순위가 크게 변하여 검색 성능이 떨어지게 된다. 이러한 문제점을 해결하기 위해 본 논문에서는 여러 특징들이 결합되어 사용될 때 각 특징에 대한 가중치를 적응적으로 부여해서 비디오 검색 성능을 개선하고자 한다. 제안한 방법을 3,200개 키 프레임으로 구성된 비디오 데이터베이스에서 실험을 하였고 다양한 성능평가 방법을 통해 제안한 방법이 기존 고정가중치 부여를 이용한 방법과 비교하여 검색 성능이 개선됨을 볼 수 있었다.

TextRank 알고리즘을 이용한 문서 범주화 (Text Categorization Using TextRank Algorithm)

  • 배원식;차정원
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권1호
    • /
    • pp.110-114
    • /
    • 2010
  • 본 논문에서는 TextRank 알고리즘을 이용한 문서 범주화 방법에 대해 기술한다. TextRank 알고리즘은 그래프 기반의 순위화 알고리즘이다. 문서에서 나타나는 각각의 단어를 노드로, 단어들 사이의 동시출현성을 이용하여 간선을 만들면 문서로부터 그래프를 생성할 수 있다. TextRank 알고리즘을 이용하여 생성된 그래프로부터 중요도가 높은 단어를 선택하고, 그 단어와 인접한 단어를 묶어 하나의 자질로 사용하여 문서 분류를 수행하였다. 동시출현 자질(인접한 단어 쌍)은 단어 하나가 갖는 의미를 보다 명확하게 만들어주므로 문서 분류에 좋은 자질로 사용될 수 있을 것이라 가정하였다. 문서 분류기로는 지지 벡터 기계, 베이지언 분류기, 최대 엔트로피 모델, k-NN 분류기 등을 사용하였다. 20 Newsgroups 문서 집합을 사용한 실험에서 모든 분류기에서 제안된 방법을 사용했을 때, 문서 분류 성능이 향상된 결과를 확인할 수 있었다.