• 제목/요약/키워드: 의미 기반 정보 추출

검색결과 676건 처리시간 0.034초

심미적 인상을 이용한 이미지 검색에 관한 실험적 연구 (An Exploratory Study of Image Retrieval Using Aesthetic Impressions)

  • 유소영;문성빈
    • 정보관리학회지
    • /
    • 제21권4호
    • /
    • pp.187-208
    • /
    • 2004
  • 이 연구에서는 심미적 인상을 이미지 검색의 고수준 자질로 이용하였다. '심미적'이라는 용어는 심리학, 예술, 문학 등에서 연구되어 왔다. 이 용어는 시각적 지각과 감정의 무의식적이고 즉각적인 측면을 의미한다. 심미적 인상과 관련된 문헌 연구를 통해 4 가지 종류의 심미적 인상을 조작적으로 정의하였다: 강한 인상, 부드러운 인상, 중후한 인상, 세련된 인상. 66개의 회화 이미지 파일을 1,000개의 회화 이미지 중에서 무작위로 추출하였으며 시지각 색상 모형을 이용하여 이 이미지 파일들로부터 저수준 색상 자질을 추출하였다. 이미지의 고수준 자질인 4가지 종류의 심미적 인상은 4명의 평가자가 리커트 7점 척도로 평가한 것을 평균내었다. 검색 실험에서 2명의 피험자는 심미적 인상이나 주제어에 대한 예제 이미지 질의를 이용해서 이미지 검색을 수행하였다. 피험자들은 심미적 인상 기반 이미지 검색 시스템에 대해서 보통 정도의 수준으로 만족했다. 그리고 색상 자질과 심미적 인상 자질을 모두 이용한 이미지 검색의 R-정확률이 색상 자질만을 이용한 이미지 검색의 R-정확률보다 높았다. 그러나 이 연구결과의 일반화를 위해서는 큰 실험 집단을 대상으로 보다 많은 검색 질의를 통한 추후 연구들이 필요할 것으로 생각된다.

토픽 모델링을 이용한 댓글 그래프 기반 소셜 마이닝 기법 (A Reply Graph-based Social Mining Method with Topic Modeling)

  • 이상연;이건명
    • 한국지능시스템학회논문지
    • /
    • 제24권6호
    • /
    • pp.640-645
    • /
    • 2014
  • 인터넷 상에서 많은 사람들은 사용자 간의 의사소통과 정보 공유, 사회적 관계를 생성하기 위한 방법으로 소셜 네트워크 서비스를 이용한다. 그 중 대표적인 트위터는 하루에 수백만 건의 소셜 데이터가 발생하기 때문에 수집되고 있는 데이터의 양이 엄청나다. 이 방대한 양의 데이터로부터 의미 있는 정보를 추출하는 소셜 마이닝이 집중적으로 연구되고 있다. 트위터는 일반적으로 유용한 정보 혹은 공유하고자 하는 내용을 팔로잉-팔로워 관계를 이용해 쉽게 전달하고 리트윗할 수 있다. 소셜 미디어에서 트윗 데이터에 대한 토픽 모델링은 이슈를 추적하기 위한 좋은 도구이다. 짧은 텍스트 기반인 트윗 데이터의 제한점을 극복하기 위해, 사용자를 노드로 사용자간 댓글과 리트윗 메시지의 여부를 간선으로 하는 그래프 구조를 갖는 댓글 그래프의 개념을 소개한다. 토픽 모델링의 대표적인 방법인 LDA 토픽 모델이 짧은 텍스트 데이터에 대해 비효율적인 것을 보완하기 위한 방법으로, 이 논문에서는 짧은 문서의 수를 줄이고 마이닝 결과의 질을 향상시키기 위한 댓글 그래프를 사용하는 토픽 모델링 방법을 소개한다. 제안한 모델은 토픽 모델링 방법으로 LDA 모델을 사용하였으며, 7일간 수집한 트윗 데이터에 대한 실험 결과를 보인다.

공간 빅데이터의 개념 및 서비스 프레임워크 구상에 관한 연구 (A Study on Concept and Services Framework of Geo-Spatial Big Data)

  • 유선철;최원욱;신동빈;안종욱
    • Spatial Information Research
    • /
    • 제22권6호
    • /
    • pp.13-21
    • /
    • 2014
  • 본 연구는 수요 및 관심이 증대되고 있는 공간 빅데이터의 개념설정과 이를 기반으로 공간 빅데이터 기술을 활용할 수 있는 서비스 프레임워크를 개념적으로 제시하는데 목적이 있다. 공간 빅데이터는 정형 반정형 비정형 공간 빅데이터를 효율적으로 수집 저장 관리하는 동시에 공간정보와 융합된 다양한 속성정보에 대해 실시간 통합 분석을 수행하여 의미 있는 정보를 추출함으로써 미래에 대응할 수 있는 기술이라 할 수 있다. 또한 공간 빅데이터는 기존 빅데이터가 가지는 3V(Volume, Variety, Velocity) 특성에 4V(Veracity, Visualization, Versatile, Value)가 추가된 특성을 가지며, 저장 관리, 분석, 서비스로 구분하여 활용범위를 설정할 수 있다. 그리고 공간 빅데이터를 활용하기 위한 서비스 측면에서의 프레임워크를 제시하였다. 구체적으로 서비스 관리, 서비스 콘테이너, 서비스 모니터링의 구성요소로 구상안을 제시하였다. 이러한 연구결과를 참조로 새로운 기술 및 기법들을 적용하여 수정 보완하고, 향후 개발예정인 저장 관리, 분석 기술개발과 연계하여 구체적인 서비스 제공방안에 대한 연구가 지속적으로 이루어져야 할 것이다.

DTD 전자서명을 이용한 XML문서의 보안성 향상 (Security Elevation of XML Document Using DTD Digital Signature)

  • 박도준;민혜란;이준
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2005년도 춘계종합학술대회
    • /
    • pp.1080-1083
    • /
    • 2005
  • DTD는 XML 문서에 표현될 자료의 의미를 정의한 메타 데이터라고 할 수 있다. 따라서 DTD 정보가 손상될 경우 이 정보를 기반으로 한 XML 문서의 보안은 심각한 문제점을 가지게 된다. 본 연구에서는 XML 문서의 송수신 과정에서 XML 문서에만 전자서명을 첨부하는 것이 아니라, DTD 에도 전자 서명을 첨부하는 방법을 제안하였다. 먼저 DTD파일을 끝까지 읽으면서 파싱을 하고 여기서 추출되는 엘리먼트나 속성, 엔티티들을 해시테이블에 저장한다. 파싱이 종료되면 해시 테이블을 읽어 들여서 메시지 다이제스트를 수행한다. 수행 후 이를 개인 키와 합성하여 전자 서명을 생성한다. 전자 서명 시 메시지 다이제스트 과정에서 바뀐 순서에 대해서는 검사하지 못하기 때문에 전혀 다른 다이제스트 값을 생성하는 문제가 발생되는데, 이것은 표준화된 구조와 문서에 대한 트리 구조를 구현할 수 있는 DOM을 이용하여 DTD의 전자 서명을 생성하는 방법으로 해결하였다.

  • PDF

종양 분류를 위한 마이크로어레이 데이터 분류 모델 설계와 구현 (The Design and Implement of Microarry Data Classification Model for Tumor Classification)

  • 박수영;정채영
    • 한국정보통신학회논문지
    • /
    • 제11권10호
    • /
    • pp.1924-1929
    • /
    • 2007
  • 오늘날 인간 프로젝트와 같은 종합적 인 연구의 궁극적 목적을 달성하기 위해서는 이 들 연구로부터 획득한 대량의 관련 데이터에 대해 새로운 현실적 의미를 부여할 수 있어야 한다. 마이크로어레이를 기반으로 하는 종양 분류 방법은 종양 종류에 따라 다르게 발현되는 유전자 양상을 통계적으로 발견함으로써 정확한 종양 분류에 기여 할 수 있다. 따라서 현재의 마이크로어레이 기술을 이용해서 효과적으로 종양을 분류하기 위해서는 특정 종양 분류와 밀접하게 관련이 있는 정보력 있는 유전자를 선택하는 과정이 필수적이다. 본 논문에서는 암에 걸린 흰쥐 외피 기간 세포 분화 실험에서 얻어진 3840 유전자의 마이크로어레이 cDNA를 이용해 데이터의 정규화를 거쳐 정보력 있는 유전자 목록을 별도로 추출하여 보다 정확한 종양 분류 모델을 구축하고 각각의 실험 결과들을 비교 분석함으로써 성능평가를 하였다. 피어슨 적률 상관 계수를 이용하여 선택된 유전자들을 멀티퍼셉트론 분류기로 분류한 결과 98.6%의 정확도를 보였다.

디지털 포렌식 기반의 침해 지표 포맷 개발 및 활용 방안 (Digital Forensic Indicators of Compromise Format(DFIOC) and Its Application)

  • 이민욱;윤종성;이상진
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제5권4호
    • /
    • pp.95-102
    • /
    • 2016
  • 기밀 정보 유출, 데이터 파괴 등 디지털 기기에 저장된 정보를 위협하는 침해사고가 계속해서 증가하고 있다. 이와 함께 디지털 침해 사고를 조사하기 위하여 디지털 포렌식 기술 또한 계속해서 발전해 왔다. 디지털 포렌식 기술의 발전으로 인하여 사용자의 행위를 추적할 수 있는 다양한 포렌식 아티팩트들이 발견되었으며, 포렌식 아티팩트로부터 정보를 추출하기 위한 다양한 포렌식 도구가 개발되었다. 하지만 포렌식 도구에서 출력하는 정보는 각기 다른 양식을 갖고 있다. 따라서 포렌식 도구에서 출력하는 정보를 다시 가공해야 하는 작업이 필요하다. 가공된 데이터는 데이터 간의 정보를 비교 분석하여 연관관계를 도출하고 그 의미를 파악해야 한다. 이를 위하여 데이터를 가공하는 작업에서 데이터의 저장과 출력을 효과적으로 하기 위한 방안이 필요하다. 본 논문에서는 침해사고 조사 분석시 필요한 다양한 포렌식 아티팩트 정보를 효과적으로 기술할 수 있는 디지털 포렌식 침해지표 작성 포맷 DFIOC(Digital Forensic Indicators Of Compromise)를 제안한다. DFIOC는 XML 기반의 포맷이며 침해사고 조사에 필요한 다양한 포렌식 아티팩트 정보를 Evidence로 표현하여 기술할 수 있다. 또한 포렌식 분석 결과를 기록하는 Forensic Analysis를 제공하고 있으며, 침해 흔적을 기록하기 위하여 Indicator 항목을 제공하고 있다. 포렌식 분석 과정에 필요한 데이터를 DFIOC 포맷의 문서 하나로 기록할 수 있게 됨으로써 불필요한 데이터 가공이 발생하지 않게 된다. 또한 정규화된 포맷을 통해 수집된 정보를 기록하기 때문에 입출력이 쉬워지며 수집된 정보를 확인하고 상호 연관관계 분석에 활용하기 쉬워진다.

사례기반추론을 이용한 초기단계 공사비 예측 방법: 속성 가중치 산정을 중심으로 (Schematic Cost Estimation Method using Case-Based Reasoning: Focusing on Determining Attribute Weight)

  • 박문서;성기훈;이현수;지세현;김수영
    • 한국건설관리학회논문집
    • /
    • 제11권4호
    • /
    • pp.22-31
    • /
    • 2010
  • 프로젝트 초기단계에서 산정된 공사비는 발주자의 중요한 의사결정에 영향을 미치므로 그 중요성이 강조되고 있지만, 정보의 부족으로 인하여 주로 견적전문가의 경험과 지식에 의존하여 진행된다. 이것은 현재 문제와 가장 유사한 과거 사례를 선택하여 사용하는 사례기반추론으로 발전되었다. 사례기반추론 모델의 예측 성능은 속성 가중치의 산정 결과에 많은 영향을 받으므로, 정확한 속성 가중치의 산정이 요구된다. 기존의 연구는 수학적 방법 또는 전문가의 주관적 판단을 이용하는 방법을 사용한다. 본 연구는 기존 연구의 문제점을 보완하기 위해 유전자 알고리즘을 이용한 사례기반추론 공사비 예측 모델을 제안한다. 공사비 예측 모델은 최근이웃 조회 방법의 과정에 의해 추출한 사례의 공사비 정보를 이용하여 예측 대상의 공사비를 산정한다. 검증 결과 AACE에서 정의한 견적시기별 예측 정확도와 표준화 회귀계수 동일가중치를 사용한 방법보다 높은 오차율을 나타내었다. 따라서 본 연구는 유전자 알고리즘을 도입하여 예측 성능을 향상시키고, 사례기반추론 방법을 사용하여 사용자가 이해하기 용이한 해결책 도출과정을 제시하였다는데 그 의미가 있다.

UbiCore : XML 기반 RFID 미들웨어 시스템 (UbiCore : An Effective XML-based RFID Middleware System)

  • 이훈순;최현화;김병섭;이명철;박재홍;이미영;김명준;진성일
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제33권6호
    • /
    • pp.578-589
    • /
    • 2006
  • 유비쿼터스 컴퓨팅의 핵심 기술로 주목 받고 있는 RFID (Radio Frequency Identification) 기술의 발달로 인해 이를 이용하여 사람들에게 편의를 제공하는 응용들이 점점 늘어나고 있다. 이러한 응용들을 쉽게 개발하기 위해서는 다양한 센서를 관리하며, 센서를 통해 수집된 태그 데이타 스트림으로부터 의미있는 데이타를 추출하여 응용에 전달해주는 미들웨어 시스템이 필요하다. 본 논문에서는 UbiCore (Ubiquitous Core)라 불리는 in 기반 RFID 미들웨어 시스템을 제안한다. UbiCore는 다음과 같은 특징을 가진다. 첫째, XQueryStream이라는 XQuery에 기반한 연속 질의 언어를 제공한다. 둘째, 프리 필터링과 중간 결과 재사용을 통해 스트림 데이타에 대한 질의 처리 속도를 향상 시킨다. 셋째, 연속적으로 생성되어 들어오는 실시간 데이타뿐 아니라 트리거에 기반하여 저장된 이력 데이타에 대한 질의를 지원한다. 넷째, 컨텍스트와 서비스의 연계 정보를 표현하기 위한 마크업 언어인 CSML(Context-driven Service Markup Language)을 제공한다.

객체지향 소프트웨어를 위한 주요 블랙박스 테스트 기법들의 비고 (Comparison of Major Black-Box Testing Methods in Object-Oriented Software)

  • 서광익;최은만
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제33권1호
    • /
    • pp.1-16
    • /
    • 2006
  • 소프트웨어의 규모가 커지면서 시스템 기능 테스트 단계에 일일이 원시코드를 참조하면서 테스트하는 것은 현실적으로 불가능하다. 따라서 시스템 테스트 단계에서 다양한 요구명세 정보들을 이용하는 블랙박스 테스트 방법들이 많이 연구되고 있다. 테스트 기법에 활용한 요구명세는 시스템을 표현하는 기술 방법과 의미의 차이로 인해 테스트 케이스와 커버리지가 크게 달라서 테스트 계획 단계에서 테스트 기법과 그 기법의 적용 결과에 대해 깊이 고려해야 한다. 이러한 필요성으로 인해 본 연구에서는 다양한 블랙박스 테스트 기법들에 대한 실험과 그 결과에 대해 논하였다. 기법의 특성이 미치는 테스트 결과를 분석하고 평가하기 위해 객체지향 시스템의 명세와 모델링 기법으로 가장 잘 알려진 UML을 이용한 테스트 기법을 포함하여 다섯 가지의 블랙박스 테스트 기법을 실행하고 비교하였다. 그리고 다섯 가지 기법들을 서로 다른 두 응용 시스템에 적용하였고 그 결과로 추출된 테스트 케이스의 커버리지를 분석하였다.

컴퓨터 그래픽 합성 이미지의 저작권 문제에 관한 고찰 (Copyright Problems In case of the Image Synthetics of Computer Graphics)

  • 이향숙
    • 디자인학연구
    • /
    • 제11권2호
    • /
    • pp.59-68
    • /
    • 1998
  • 신 정부의 새 정부 100대과제중 정보화 분야에 관한 발표 내용을 살펴보면, 2002년까지 전국 모든 지역에서 시내요금으로 인터넷을 쓸 수 있는 인터넷 전용망을 구축하고 2010년까지 32조원을 투자해 전국에 ‘초고속통신망(공식명칭은 새 빛 망)’을 구축할 것이며 위성방송수신기, 영상 소프트웨어 등 위성산업을 활성화하여 모든 방송의 디지털화를 유도한다는 것이다. 시장통합과 정보통신 기반 구축에 따르는 국제적 쟁점을 살펴보면 무엇보다도‘표준설정’과‘지적재산권’(intellectual property)보호가 국제질서와 국내제도의 조화되는 측면에서 중요한 현안이 되고 있다. 인간의 창작물로써의 저작물들은 정보화 시대를 맞이하여 비트 화되고 멀티미디어 화되고 있는 상황이다. 시뮬레이션이 지배하는 현대사회에서 정보는 기호화되면 누구나 가까이 접하게 됨으로써 이미지 기호의 수집과 합성은 윤리적 관점을 떠나 하나의 미래를 제시해 줄 것이다. 단지 포스트모던 시대에서 원본과 복제물의 차이와 의미가 소멸 될 것이라는 우려와 함께 문제는 저작자의 지적소유권과 권익을 어떻게 설정할 것인가가 문제이다. 이러한 상황을 접하면서 정보화 시대에서의 디지털의 이론적 개념과 사진이 디지털 화되는 과정을 통해 정보의 공유 성을 제시하고 그 윤리성을 추출해보며, 비주얼 이미지의 컴퓨터 그래픽적 합성을 포스트모던 시대의 이미지 합성 관점에서 살펴보고, 21C를 맞이하는 초고속통신망 시대의 지적 소유권에 관한 고찰을 통해서 문제점을 파악함으로써 궁극적으로 이미지 창출자로서의 앞으로 우리가 나아가야 할 방향과 저작권자의 권익을 도출해 보고 져했다.

  • PDF