• 제목/요약/키워드: cosine distance

검색결과 63건 처리시간 0.023초

Image Retrieval Based on the Weighted and Regional Integration of CNN Features

  • Liao, Kaiyang;Fan, Bing;Zheng, Yuanlin;Lin, Guangfeng;Cao, Congjun
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제16권3호
    • /
    • pp.894-907
    • /
    • 2022
  • The features extracted by convolutional neural networks are more descriptive of images than traditional features, and their convolutional layers are more suitable for retrieving images than are fully connected layers. The convolutional layer features will consume considerable time and memory if used directly to match an image. Therefore, this paper proposes a feature weighting and region integration method for convolutional layer features to form global feature vectors and subsequently use them for image matching. First, the 3D feature of the last convolutional layer is extracted, and the convolutional feature is subsequently weighted again to highlight the edge information and position information of the image. Next, we integrate several regional eigenvectors that are processed by sliding windows into a global eigenvector. Finally, the initial ranking of the retrieval is obtained by measuring the similarity of the query image and the test image using the cosine distance, and the final mean Average Precision (mAP) is obtained by using the extended query method for rearrangement. We conduct experiments using the Oxford5k and Paris6k datasets and their extended datasets, Paris106k and Oxford105k. These experimental results indicate that the global feature extracted by the new method can better describe an image.

사용자 기반과 아이템 기반 협업여과 추천기법에 관한 실증적 연구 (A Empirical Study on Recommendation Schemes Based on User-based and Item-based Collaborative Filtering)

  • 김예나;최인복;박태근;이재동
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 추계학술발표대회
    • /
    • pp.714-717
    • /
    • 2008
  • 협업여과 추천기법에는 사용자 기반 협업여과와 아이템 기반 협업여과가 있으며, 절차는 유사도 측정, 이웃 선정, 예측값 생성 단계로 이루어진다. 유사도 측정 단계에는 유클리드 거리(Euclidean Distance), 코사인 유사도(Cosine Similarity), 피어슨 상관계수(Pearson Correlation Coefficient) 방법 등이 있고, 이웃 선정 단계에는 상관 한계치(Correlation-Threshold), 근접 N 이웃(Best-N-Neighbors) 방법 등이 있다. 마지막으로 예측값 생성 단계에는 단순평균(Simple Average), 가중합(Weighted Sum), 조정 가중합(Adjusted Weighted Sum) 등이 있다. 이처럼 협업여과 추천기법에는 다양한 기법들이 사용되고 있다. 따라서 본 논문에서는 사용자 기반 협업여과와 아이템 기반 협업여과 추천기법에 사용되는 유사도 측정 기법과 예측값 생성 기법의 최적화된 조합을 알아보기 위해 성능 실험 및 비교 분석을 하였다. 실험은 GroupLens의 MovieLens 데이터 셋을 활용하였고 MAE(Mean Absolute Error)값을 이용하여 추천기법을 비교 하였다. 실험을 통해 유사도 측정 기법과 예측값 생성 기법의 최적화된 조합을 찾을 수 있었고, 사용자 기반 협업여과와 아이템 기반 협업여과의 성능비교를 통해 아이템 기반 협업여과의 성능이 보다 우수했음을 확인 하였다.

극 좌표계 원형 홍채영상에서의 특징 검출에 의한 홍채인식 연구 (A Study on Iris Recognition by Iris Feature Extraction from Polar Coordinate Circular Iris Region)

  • 정대식;박강령
    • 대한전자공학회논문지SP
    • /
    • 제44권3호
    • /
    • pp.48-60
    • /
    • 2007
  • 기존의 연구에서는 홍채 특징 추출을 위해 검출된 원형 홍채 영역을 직교 사각형 홍채 영상으로 스트레칭 및 보간 하는 작업을 수행하였다. 이러한 경우 실제 홍채 특징이 왜곡되는 현상이 발생한다. 본 논문에서는 홍채 영상의 왜곡 없이 정확하게 홍채 특징을 추출할 수 있는 방법을 제안한다. 본 연구는 다음과 같은 세 가지 장점을 가지고 있다. 첫 번째, 극좌표 원형 영상 방식을 이용하여 기존의 직교 사각형 영상 방식보다 인식 성능 면에서 우수하다는 점을 해밍거리, 코사인거리, 유클리디안 거리의 3가지 metric을 이용하여 실제로 비교해본 점이며, 두 번째, 최근 홍채인식 연구의 주된 흐름인 품질이 좋지 못한 Non-Ideal 홍채 영상 중 하나의 형태인 홍채 카메라의 중심을 쳐다보지 않은 상태에서 취득된 홍채 영상의 동공과 홍채 중심 위치가 많이 차이나는 경우에 동공과 홍채 경계를 각각 원형 경계 검출로 경계를 찾은 후, 영상에 대한 보간(interpolation)없이 극좌표 원형 홍채 영상에서 직접 특징을 추출함으로써 홍채인식의 성능을 향상한 점이다. 마지막 세 번째는 극좌표 원형방식을 사용할 경우 발생하는 중복 포인트 문제를 해결한 것이다. 이러한 중복 포인트들은 같은 위치에서 여러 홍채 특징을 추출하는 현상을 야기함으로서 저주파 홍채 특징을 생성하는 결과를 낳게 된다. 즉, 홍채 특징의 신호 변화가 실제로 존재함에도 불구하고 같은 위치에서의 여러 홍채 특징들을 추출함으로써 파형변화가 적은 비슷한 홍채 신호를 만들게 된다. 중복 포인트가 주기적으로 많이 발생하는 동공부근의 첫 번째 트랙에 가버필더 적용 시 필터의 주파수를 작게 하여 중복 포인트에 의해 발생된 저주파 홍채 신호를 정확하게 추출하게 함으로써 홍채 인식 성능을 향상 시킨 점이다. 실험 결과, 기존의 직교 사각형 영상 기반 방식이 EER 0.29% 와 d'값 5.8 이였으며, 제안하는 극좌표 원형 방식이 EER 0.16% 와 d'값 6.4로 인식 성공률이 보다 높음을 알 수 있었다.

200kW 탑형 태양열발전시스템의 Heliostat Field 설계 (Design of Heliostat Field for 200kW Tower Type Solar Thermal Power Plant)

  • 박영칠
    • 한국태양에너지학회 논문집
    • /
    • 제32권5호
    • /
    • pp.41-51
    • /
    • 2012
  • Heliostat field is the most important subsystem in the tower type solar thermal power plant since its optical performance affects the total system efficiency most significantly while the construction cost of it is the major part of total construction cost in such a power plant. Thus a well designed heliostat field to maximize the optical efficiency as well as to minimize the land usage is very important. This work presents methodology, procedures and result of heliostat filed design for 200kW solar thermal power plant built recently in Daegu, Korea. A $2{\times}2(m)$ rectangular shaped receiver located at 43(m) high and tilted $28^{\circ}$ toward heliostat field, 450 of heliostats of which the reflective surface is formed by 4 of $1{\times}1(m)$ flat plate mirror facet, and the land area having about $140{\times}120(m)$ size are used to form the heliostat field. A procedure to deploy 450 heliostats in radial staggered nonblocking formation is developed. Also the procedures to compute the cosine effect, intercept ratio, blocking and shading ratio in the field are developed. Finally the heliostat filed is designed by finding the optimal radial distance and azimuthal spacing in radial staggered nonblocking formation such that the designed heliostat field optical efficiency could be maximized. The designed heliostat field has 77% of annual average optical efficiency, which is obtained by annually averaging the optical efficiencies computed between the time of where sun elevation angle becomes $10^{\circ}$ after sunrise and the time of where sun elevation angle becomes $10^{\circ}$ before sunset in each day.

R&D과제의 기술분류를 이용한 사업간 유사도 분석 기법에 관한 연구 (A study on Similarity analysis of National R&D Programs using R&D Project's technical classification)

  • 김주호;김영자;김종배
    • 디지털콘텐츠학회 논문지
    • /
    • 제13권3호
    • /
    • pp.317-324
    • /
    • 2012
  • 최근 R&D 투자효율성 제고를 목표로 사업 간의 유사중복 조정에 대한 중요성이 강조되고 있으나, 과제 혹은 예산요구서 내용 등을 텍스트 기반으로 비교하는 기존 유사검색 방식은 내용의 품질 편차 등으로 인해 유의미한 유사성 도출에 제한점이 있다. 이러한 텍스트 기반의 키워드 추출을 통한 유사검색 한계성을 극복하기 위한 방안으로 본 연구에서는 사업 간 유사도 분석 시 과제의 기술분류를 활용한다. 국가R&D사업 조사 분석 시 수집된 과제들의 과학기술표준분류를 추출하여 사업별 고유벡터 모형을 생성 후 이를 이용하여 코사인 기반, 유클리디안 거리기반 알고리즘을 통해 각 사업 간 유사도를 측정하였으며 기존 키워드 추출방식으로 유사도를 측정한 결과와의 비교를 통해 연구 효율성을 검증하였다.

이상탐지 활용 전자집단민원 추정 방법론에 관한 탐색적 연구: 창원시 시민의 소리 사례를 중심으로 (An Exploratory Study of Collective E-Petitions Estimation Methodology Using Anomaly Detection: Focusing on the Voice of Citizens of Changwon City)

  • 정하영
    • 정보화정책
    • /
    • 제26권4호
    • /
    • pp.85-106
    • /
    • 2019
  • 최근 전자민원시스템에 집단민원을 제기하는 사례가 늘어나고 있으나 이에 대한 효율적인 관리시스템이 아직 마련되어 있지 않아 행정 업무량 증대와 사회적 갈등 양산 등의 부작용이 우려되고 있다. 이에 본 연구에서는 이상탐지와 코퍼스 언어학 기반의 내용분석을 활용한 전자 집단민원 추정 방법론을 제시하고자 하였다. 이를 위하여 1)집단민원의 개념에 대한 이론적 고찰과 2) 비모수적 비지도 학습에 기반 한 이상탐지를 활용한 전자 집단민원 추정과 3) n-gram 코사인 각도 거리를 활용한 민원의 내용 유사도 분석방법론을 제안하고 4) 창원시 시민의 소리에 대한 사례분석을 통하여 제시한 방법론의 유용성과 정책적 시사점, 향후 과제를 검토하였다.

한국어 어휘 의미망(alias. KorLex)의 지식 그래프 임베딩을 이용한 문맥의존 철자오류 교정 기법의 성능 향상 (Performance Improvement of Context-Sensitive Spelling Error Correction Techniques using Knowledge Graph Embedding of Korean WordNet (alias. KorLex))

  • 이정훈;조상현;권혁철
    • 한국멀티미디어학회논문지
    • /
    • 제25권3호
    • /
    • pp.493-501
    • /
    • 2022
  • This paper is a study on context-sensitive spelling error correction and uses the Korean WordNet (KorLex)[1] that defines the relationship between words as a graph to improve the performance of the correction[2] based on the vector information of the word embedded in the correction technique. The Korean WordNet replaced WordNet[3] developed at Princeton University in the United States and was additionally constructed for Korean. In order to learn a semantic network in graph form or to use it for learned vector information, it is necessary to transform it into a vector form by embedding learning. For transformation, we list the nodes (limited number) in a line format like a sentence in a graph in the form of a network before the training input. One of the learning techniques that use this strategy is Deepwalk[4]. DeepWalk is used to learn graphs between words in the Korean WordNet. The graph embedding information is used in concatenation with the word vector information of the learned language model for correction, and the final correction word is determined by the cosine distance value between the vectors. In this paper, In order to test whether the information of graph embedding affects the improvement of the performance of context- sensitive spelling error correction, a confused word pair was constructed and tested from the perspective of Word Sense Disambiguation(WSD). In the experimental results, the average correction performance of all confused word pairs was improved by 2.24% compared to the baseline correction performance.

텍스트 마이닝 기법을 활용한 어깨 재활 연구분야 동향과 키워드 모델링 (The Research Trends and Keywords Modeling of Shoulder Rehabilitation using the Text-mining Technique)

  • 김준희;정성훈;황의재
    • 대한물리의학회지
    • /
    • 제16권2호
    • /
    • pp.91-100
    • /
    • 2021
  • PURPOSE: This study analyzed the trends and characteristics of shoulder rehabilitation research through keyword analysis, and their relationships were modeled using text mining techniques. METHODS: Abstract data of 10,121 articles in which abstracts were registered on the MEDLINE of PubMed with 'shoulder' and 'rehabilitation' as keywords were collected using python. By analyzing the frequency of words, 10 keywords were selected in the order of the highest frequency. Word-embedding was performed using the word2vec technique to analyze the similarity of words. In addition, the groups were classified and analyzed based on the distance (cosine similarity) through the t-SNE technique. RESULTS: The number of studies related to shoulder rehabilitation is increasing year after year, keywords most frequently used in relation to shoulder rehabilitation studies are 'patient', 'pain', and 'treatment'. The word2vec results showed that the words were highly correlated with 12 keywords from studies related to shoulder rehabilitation. Furthermore, through t-SNE, the keywords of the studies were divided into 5 groups. CONCLUSION: This study was the first study to model the keywords and their relationships that make up the abstracts of research in the MEDLINE of Pub Med related to 'shoulder' and 'rehabilitation' using text-mining techniques. The results of this study will help increase the diversifying research topics of shoulder rehabilitation studies to be conducted in the future.

사례기반추론과 텍스트마이닝 기법을 활용한 KTX 차량고장 지능형 조치지원시스템 연구 (An Intelligence Support System Research on KTX Rolling Stock Failure Using Case-based Reasoning and Text Mining)

  • 이형일;김종우
    • 지능정보연구
    • /
    • 제26권1호
    • /
    • pp.47-73
    • /
    • 2020
  • KTX 차량은 수많은 기계, 전기 장치 및 부품들로 구성되어 있는 하나의 시스템으로 차량의 유지보수에는 상당히 많은 전문성과 유지보수 작업자들의 경험을 필요로 한다. 차량 고장발생 시 유지보수자의 지식과 경험에 따라 문제 해결의 시간과 작업의 질적 차이가 발생하며 그에 따른 차량의 가용율이 달라진다. 일반적으로 문제해결은 고장 매뉴얼을 기반으로 하지만 경험이 많고 능숙한 전문가의 경우는 이와 더불어 개인의 노하우를 접목하여 신속하게 진단하고 조치를 취한다. 이러한 지식은 암묵지 형태로 존재하기 때문에 후임자에게 완전히 전수되기 어려우며, 이를 위해 사례기반의 철도차량 전문가시스템을 개발하여 데이터화된 지식으로 바꾸려고 하는 연구들이 있어왔다. 하지만, 간선에 가장 많이 투입되고 있는 KTX 차량에 대한 연구나 텍스트의 특징을 추출하여 유사사례를 검색하는 시스템 개발은 아직 미비하다. 따라서, 본 연구에서는 이러한 차량 유지보수 전문가들의 노하우를 통해 수행된 고장들에 대한 진단과 조치 이력을 문제 해결의 사례로 활용하여 새롭게 발생하는 고장에 대한 조치가이드를 제공하는 지능형 조치지원시스템을 제안하고자 한다. 이를 위하여, 2015년부터 2017년동안 생성된 차량고장 데이터를 수집하여 사례베이스를 구축하였고, 차원축소 기법인 비음수 행렬 인수분해(NMF), 잠재의미분석(LSA), Doc2Vec을 통해 고장의 특징을 추출하여 벡터 간의 코사인 거리를 측정하는 방식으로 유사 사례를 검색하였으며, 위의 알고리즘에 의해 제안된 조치내역들 간 성능을 비교하였다. 분석결과, 고장 내역의 키워드가 적은 경우의 유사 사례 검색과 조치 제안은 코사인 유사도를 직접 적용하는 경우에도 좋은 성능을 낸다는 것을 알 수 있었고 차원 축소 기법들의 성능 비교를 통해 문맥적 의미를 보존하는 차원 축소 방식 중 Doc2Vec을 적용하는 것이 가장 좋은 성능을 나타낸다는 것을 알 수 있었다. 텍스트 마이닝 기술은 여러 분야에서 활용을 위한 연구들이 이루어지고 있는 추세이나, 본 연구에서 활용하고자 하는 분야처럼 전문적인 용어들이 다수이고 데이터에 대한 접근이 제한적인 환경에서 이러한 텍스트 데이터를 활용한 연구는 아직 부족한 실정이다. 본 연구는 이러한 관점에서 키워드 기반의 사례 검색을 보완하고자 텍스트 마이닝 기법을 접목하여 고장의 특징을 추출하는 방식으로 사례를 검색해 조치를 제안하는 지능형 진단시스템을 제시하였다는 데에 의의가 있다. 이를 통해 현장에서 바로 사용 가능한 진단시스템을 단계적으로 개발하는데 기초자료로써 시사점을 제공할 수 있을 것으로 기대한다.

APPLICATION OF TIME-OF-FLIGHT NEAR INFRARED SPECTROSCOPY TO WOOD

  • Tsuchikawa, Satoru;Tsutsumi, Shigeaki
    • 한국근적외분광분석학회:학술대회논문집
    • /
    • 한국근적외분광분석학회 2001년도 NIR-2001
    • /
    • pp.1182-1182
    • /
    • 2001
  • In this study, the newly constructed optical measurement system, which was mainly composed of a parametric tunable laser and a near infrared photoelectric multiplier, was introduced to clarify the optical characteristics of wood as discontinuous body with anisotropic cellular structure from the viewpoint of the time-of-flight near infrared spectroscopy (TOF-NIRS). The combined effects of the cellular structure of wood sample, the wavelength of the laser beam λ, and the detection position of transmitted light on the time resolved profiles were investigated in detail. The variation of the attenuance of peak maxima At, the time delay of peak maxima Δt and the variation of full width at half maximum Δw were strongly dependent on the feature of cellular structure of a sample and the wavelength of the laser beam. The substantial optical path length became about 30 to 35 times as long as sample thickness except the absorption band of water. Δt ${\times}$ Δw representing the light scattering condition increased exponentially with the sample thickness or the distance between the irradiation point and the end of sample. Around the λ=900-950 nm, there may be considerable light scattering in the lumen of tracheid, which is multiple specular reflection and easy to propagate along the length of wood fiber. Such tendency was remarkable for soft wood with the aggregate of thin layers of cell walls. When we apply TOF-NIRS to the cellular structural materials like wood, it is very important to give attention to the difference in the light scattering within cell wall and the multiple specular-like reflections between cell walls. We tried to express the characteristics of the time resolved profile on the basis of the optical parameters for light propagation determined by the previous studies, which were absorption coefficient K and scattering coefficient S from Kubelka-Munk theory and n from nth power cosine model of radiant intensity. The wavelength dependency of the product of K/S and n, which expressed the light-absorbing and -scattering condition and the degree of anisotropy, respectively, was similar to that of the time delay of peak maxima Δt. The variation of the time resolved profile is governed by the combination of these parameters. So, we can easily find the set of parameters for light propagation synthetically from Δt.

  • PDF