• Title/Summary/Keyword: 대용량 태그

Search Result 35, Processing Time 0.024 seconds

Flickr Image Classification using SIFT Algorism (SIFT 알고리즘을 이용한 플리커 이미지 자동분류)

  • Jang, Hyun-Woong;Cho, Soo-Sun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2013.11a
    • /
    • pp.1394-1396
    • /
    • 2013
  • 플리커와 같은 대용량 영상저장 및 공유 사이트가 인기를 끌면서 이미지 정보의 양은 점점 늘어나고 있고 사용자들은 정확한 이미지 정보 검색을 요구하고 있다. 태그기반의 이미지 검색에서 정확도를 높이기 위하여 태그들의 의미적 연관성을 이용하는 등 다양한 연구가 진행되고 있다. 본 논문에서는 특징점 추출에 기반하여 이미지를 분류하는데 뛰어난 성능을 가진 SIFT알고리즘을 사용하여 플리커 이미지를 분류하는 방법을 제안한다. 위키피디아 의미 연관성을 이용해 태그 정보로 1차 분류된 데이터베이스에 SIFT알고리즘을 사용해본 결과 기존의 SURF를 사용한 연구보다 높은 정확성을 보이는 것을 확인하였다. 따라서 이 방법을 통하여 다양한 이미지를 더욱 정확하게 분류할 수 있을 것으로 기대한다.

A Study on Efficiency of the EPCIS using Altibase DBMS (Altibase DBMS를 활용한 EPCIS 효율화 방안 연구)

  • Piao, Xue-Hua;Lee, Doo-Yong;Song, Young-Keun;Kwon, Dae-Woo;Jho, Yong-Chul;Lee, Chang-Ho
    • Proceedings of the Safety Management and Science Conference
    • /
    • 2010.04a
    • /
    • pp.167-172
    • /
    • 2010
  • EPCIS(EPC Information Service)시스템은 EPC기반의 정보교환을 목표로 EPC global Network 상에서 RFID 태그에 기록된 화물의 EPC데이터, 인식시점, 인식장소 등의 정보를 제공하는 EPCglobal Architecture Framework의 구성요소 중 핵심부분이라고 할 수 있다. 본 논문에서는 EPCIS 시스템의 구성요소 중 동시에 수많은 RFID 단말기로부터 입력되는 대용량의 EPCIS Event 데이터를 지속적으로 저장하고 관리하는 EPCIS Repository를 효율적으로 관리하기 위하여 고성능이 필요한 데이터와 대용량이 필요한 데이터를 모두 처리할 수 있는 Hybrid DBMS를 적용하여 EPCIS Repository를 효율적으로 관리할 수 있는 방안을 제시하고자 한다.

  • PDF

Robust Part-of-Speech Tagger using Statistical and Rule-based Approach (통계와 규칙을 이용한 강인한 품사 태거)

  • Shim, Jun-Hyuk;Kim, Jun-Seok;Cha, Jong-Won;Lee, Geun-Bae
    • Annual Conference on Human and Language Technology
    • /
    • 1999.10d
    • /
    • pp.60-75
    • /
    • 1999
  • 품사 태깅은 자연 언어 처리의 가장 기본이 되는 부분으로 상위 자연 언어 처리 부분인 구문 분석, 의미 분석의 전처리로 사용되고, 독립된 응용으로 언어의 정보를 추출하거나 정보 검색 등의 응용에 사용되어 진다. 품사 태깅은 크게 통계에 기반한 방법, 규칙에 기반한 방법, 이 둘을 모두 이용하는 혼합형 방법 등으로 나누어 연구되고 있다. 포항공대 자연언어처리 연구실의 자연 언어 처리 엔진(SKOPE)의 품사 태깅 시스템 POSTAG는 미등록어 추정이 강화된 혼합형 품사 태깅 시스템이다 본 시스템은 형태소 분석기, 통계적 품사 태거, 에러 수정 규칙 후처리기로 구성되어 있다. 이들은 각각 단순히 직렬 연결되어 있는 것이 아니라 형태소 접속 테이블을 기준으로 분석 과정에서 형태소 접속 그래프를 생성하고 처리하면서 상호 밀접한 연관을 가진다. 그리고, 미등록어용 패턴사전에 의해 등록어와 동일한 방법으로 미등록어를 처리함으로써 효율적이고 강건한 품사 태깅을 한다. 한편, POSTAG에서 사용되는 태그세트와 한국전자통신연구원(ETRI)의 표준 태그세트 간에 양방향으로 태그세트 매핑을 함으로써, 표준 태그세트로 태깅된 코퍼스로부터 POSTAC를 위한 대용량 학습자료를 얻고 POSTAG에서 두 가지 태그세트로 품사 태깅 결과 출력이 가능하다. 본 시스템은 MATEC '99'에서 제공된 30000어절에 대하여 표준 태그세트로 출력한 결과 95%의 형태소단위 정확률을 보였으며, 태그세트 매핑을 제외한 POSTAG의 품사 태깅 결과 97%의 정확률을 보였다.

  • PDF

Dynamic Virtual Ontology using Tags with Semantic Relationship on Social-web to Support Effective Search (효율적 자원 탐색을 위한 소셜 웹 태그들을 이용한 동적 가상 온톨로지 생성 연구)

  • Lee, Hyun Jung;Sohn, Mye
    • Journal of Intelligence and Information Systems
    • /
    • v.19 no.1
    • /
    • pp.19-33
    • /
    • 2013
  • In this research, a proposed Dynamic Virtual Ontology using Tags (DyVOT) supports dynamic search of resources depending on user's requirements using tags from social web driven resources. It is general that the tags are defined by annotations of a series of described words by social users who usually tags social information resources such as web-page, images, u-tube, videos, etc. Therefore, tags are characterized and mirrored by information resources. Therefore, it is possible for tags as meta-data to match into some resources. Consequently, we can extract semantic relationships between tags owing to the dependency of relationships between tags as representatives of resources. However, to do this, there is limitation because there are allophonic synonym and homonym among tags that are usually marked by a series of words. Thus, research related to folksonomies using tags have been applied to classification of words by semantic-based allophonic synonym. In addition, some research are focusing on clustering and/or classification of resources by semantic-based relationships among tags. In spite of, there also is limitation of these research because these are focusing on semantic-based hyper/hypo relationships or clustering among tags without consideration of conceptual associative relationships between classified or clustered groups. It makes difficulty to effective searching resources depending on user requirements. In this research, the proposed DyVOT uses tags and constructs ontologyfor effective search. We assumed that tags are extracted from user requirements, which are used to construct multi sub-ontology as combinations of tags that are composed of a part of the tags or all. In addition, the proposed DyVOT constructs ontology which is based on hierarchical and associative relationships among tags for effective search of a solution. The ontology is composed of static- and dynamic-ontology. The static-ontology defines semantic-based hierarchical hyper/hypo relationships among tags as in (http://semanticcloud.sandra-siegel.de/) with a tree structure. From the static-ontology, the DyVOT extracts multi sub-ontology using multi sub-tag which are constructed by parts of tags. Finally, sub-ontology are constructed by hierarchy paths which contain the sub-tag. To create dynamic-ontology by the proposed DyVOT, it is necessary to define associative relationships among multi sub-ontology that are extracted from hierarchical relationships of static-ontology. The associative relationship is defined by shared resources between tags which are linked by multi sub-ontology. The association is measured by the degree of shared resources that are allocated into the tags of sub-ontology. If the value of association is larger than threshold value, then associative relationship among tags is newly created. The associative relationships are used to merge and construct new hierarchy the multi sub-ontology. To construct dynamic-ontology, it is essential to defined new class which is linked by two more sub-ontology, which is generated by merged tags which are highly associative by proving using shared resources. Thereby, the class is applied to generate new hierarchy with extracted multi sub-ontology to create a dynamic-ontology. The new class is settle down on the ontology. So, the newly created class needs to be belong to the dynamic-ontology. So, the class used to new hyper/hypo hierarchy relationship between the class and tags which are linked to multi sub-ontology. At last, DyVOT is developed by newly defined associative relationships which are extracted from hierarchical relationships among tags. Resources are matched into the DyVOT which narrows down search boundary and shrinks the search paths. Finally, we can create the DyVOT using the newly defined associative relationships. While static data catalog (Dean and Ghemawat, 2004; 2008) statically searches resources depending on user requirements, the proposed DyVOT dynamically searches resources using multi sub-ontology by parallel processing. In this light, the DyVOT supports improvement of correctness and agility of search and decreasing of search effort by reduction of search path.

Automatic Generation of Named Entity Tagged Corpus using Web Search Engine (웹을 이용한 개체명 부착 말뭉치의 자동생성과 정제)

  • An, Joo-Hui;Lee, Seung-Woo;Lee, Gary Geun-Bae
    • Annual Conference on Human and Language Technology
    • /
    • 2002.10e
    • /
    • pp.85-91
    • /
    • 2002
  • 최근 정보 추출, 질의응답 시스템 등의 고정밀 자연어처리 어플리케이션이 부각됨에 따라 개체명 인식의 중요성이 더욱 커지고 있다. 이러한 개체명 인식을 위한 학습에는 대용량의 어휘자료를 필요로 하기 때문에 충분한 학습 데이터, 즉 개체명 태그가 부착된 충분한 코퍼스가 제공되지 못하는 경우 자료희귀문제(data sparseness problem)로 인하여 목적한 효과를 내지 못하는 경우가 않다. 그러나 태그가 부착된 코퍼스를 생성하는 일은 시간과 인력이 많이 드는 힘든 작업이다. 최근 인터넷의 발전으로 웹 데이터는 그 양이 매우 많으며, 습득 또한 웹 검색 엔진을 사용해서 자동으로 모음으로써 다량의 말뭉치를 모으는 것이 매우 용이하다. 따라서 최근에는 웹을 무한한 언어자원으로 보고 웹에서 필요한 언어자원을 자동으로 뽑는 연구가 활발히 진행되고 있다. 본 연구는 이러한 연구의 첫 시도로 웹으로부터 다량의 원시(raw) 코퍼스를 얻어 개체명 태깅 학습을 위한 태그 부착 코퍼스를 자동으로 생성하고 이렇게 생성된 말뭉치를 개체면 태깅 학습에 적용하는 비교 실험을 통해 수집된 말뭉치의 유효성을 검증하고자 한다. 향후에는 자동으로 웹으로부터 개체 명 태깅 규칙과 패턴을 뽑아내어 실제 개체명 태거를 빨리 개발하여 유용하게 사용할 수 있다.

  • PDF

Implementation of RFID Data Transmission System using Wireless LAN (무선LAN 기반 RFID 데이터 전송시스템 구현)

  • 김종호;김영길;백수열
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.8 no.6
    • /
    • pp.1055-1059
    • /
    • 2004
  • A RFID(Radio Frequency Identification) system is a kind of radio frequency communication system and a branch of automatic data collection system. RFID system consists of RFID tags(or transponders) and RFID readers(controllers). This paper deals with the wireless communication that acquires tag IDs through RFID readers, and show the implementation of the target system which transmits tag IDs and related information to the server on the Internet through the wireless local area network. Today's RFID systems are usually implemented with the wired communication environment. In this paper, however, RFID system is effectively realized with the widely deployed wireless local area network and various RFID data can be collected by the readers which are communicating with the wireless access points of the local area network. Through the Internet, users also can have easy access to the server on the web and retrieve, analyze, and utilize tags' information.

Techniques for Efficient Reading of Semi-Passive Sensor Tag Data (반수동형 센서 태그 데이터의 효율적인 읽기 기법)

  • Kim, Soo-Han;Ryu, Woo-Seok;Hong, Bong-Hee
    • Journal of the Institute of Electronics Engineers of Korea CI
    • /
    • v.46 no.3
    • /
    • pp.34-41
    • /
    • 2009
  • This paper investigates the issue of efficient reading for sensor data of semi-passive sensor tag. The Cold Chain management system requires complete sensor data without data loss and the short processing time of reading sensor tag data. However, reading the sensed data could be interfered by RF environment such as a jamming, obstacle and so on. This study found that it could lead to loss of the sensed data and takes much time to read it when data loss is occurred. To solve this problem, we propose the transaction processing mechanism that guarantees efficient reading of the sensed data. To do this, we present the technique of dynamic packet size and technique of data recovery to execute read transaction. These techniques improve the reliability of reading operation as well as speed up of read process for the large capacity data. This paper contributes to the improvement of efficient reading of sensed data without any loss of data and large time required.

Image Classification Using Bag of Visual Words and Visual Saliency Model (이미지 단어집과 관심영역 자동추출을 사용한 이미지 분류)

  • Jang, Hyunwoong;Cho, Soosun
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.3 no.12
    • /
    • pp.547-552
    • /
    • 2014
  • As social multimedia sites are getting popular such as Flickr and Facebook, the amount of image information has been increasing very fast. So there have been many studies for accurate social image retrieval. Some of them were web image classification using semantic relations of image tags and BoVW(Bag of Visual Words). In this paper, we propose a method to detect salient region in images using GBVS(Graph Based Visual Saliency) model which can eliminate less important region like a background. First, We construct BoVW based on SIFT algorithm from the database of the preliminary retrieved images with semantically related tags. Second, detect salient region in test images using GBVS model. The result of image classification showed higher accuracy than the previous research. Therefore we expect that our method can classify a variety of images more accurately.

Automatic Tagging for Social Images using Convolution Neural Networks (CNN을 이용한 소셜 이미지 자동 태깅)

  • Jang, Hyunwoong;Cho, Soosun
    • Journal of KIISE
    • /
    • v.43 no.1
    • /
    • pp.47-53
    • /
    • 2016
  • While the Internet develops rapidly, a huge amount of image data collected from smart phones, digital cameras and black boxes are being shared through social media sites. Generally, social images are handled by tagging them with information. Due to the ease of sharing multimedia and the explosive increase in the amount of tag information, it may be considered too much hassle by some users to put the tags on images. Image retrieval is likely to be less accurate when tags are absent or mislabeled. In this paper, we suggest a method of extracting tags from social images by using image content. In this method, CNN(Convolutional Neural Network) is trained using ImageNet images with labels in the training set, and it extracts labels from instagram images. We use the extracted labels for automatic image tagging. The experimental results show that the accuracy is higher than that of instagram retrievals.

Collecting Affective Images using Affective Word List (감성어휘를 이용한 감성이미지 수집)

  • Lyu, Ki-Gon;Lim, Heui-Seock;Nam, Ki-Chun;Kim, Hyeon-Cheol
    • Annual Conference on Human and Language Technology
    • /
    • 2010.10a
    • /
    • pp.114-117
    • /
    • 2010
  • 특정 대상 또는 외부 자극에 대해 반사적이고 직관적으로 발생하는 느낌으로 정의되는 감성은 자신의 경험을 바탕으로 개개인이 서로 다른 반응을 보이는 특징을 가진다. 이러한 감성은 맞춤형, 적응형 및 개인화된 서비스를 요구하는 현대사회에서 반드시 필요하고 연구되어야 하는 대상이다. 하지만, 감성은 외부 자극에 따라 빠르게 변하고 객관성을 유지하기 어려울 뿐 아니라 복합적으로 나타나기 때문에 측정하거나 표현하기가 매우 어렵다. 시각정보는 감성을 이해하고 전달하는 데 큰 비중을 차지하며, 대상에 대한 종합적인 정보를 전달하여 빠르게 인지하고 이해하는데 많은 도움을 준다. 그 중 색채정보는 대상의 객관적인 특정, 심리적 속성 및 사회적 배경을 반영할 수 있어 복합적인 감성을 효과적으로 표현하고 전달한다. 많은 연구를 통해 감성과 색채정보 간의 관계를 생성하고 정의하였지만, 단일 시각정보로 감성을 표현하는 것은 한계가 있다. 본 논문에서는 종합적인 시각정보를 고려한 감성연구를 제안하기 위해 대용량의 감성어휘와 이미지를 수집하였다. 감성어휘는 The Center for the Study of Emotion and Attention(CSEA)에서 생성한 균형 감성어휘 중 273개를 사용하였고 감성이미지는 객관성과 공통성을 유지하기 위해 사용자의 참여가 활발하고 이미지에 부착된 태그가 비교적 정확한 Flickr를 사용하여 수집하였다. 감성어휘 당 약 500개의 이미지를 수집하고자 시도하였고, 총 130,944개의 감성이미지 후보를 수집하였다. 한 번 수집된 이미지는 중복을 피하였고, JPEG형식으로 저장되어 있다. 또한, 각 이미지에는 사용자 태그가 평균적으로 약 25개가 포함되어 있고, 총 2,l47,645개의 태그를 수집하였다.

  • PDF