• 제목/요약/키워드: 의미 기반

검색결과 5,239건 처리시간 0.033초

가상 머신 기반으로 난독화된 실행파일의 구조 및 원본의미 추출 동적 방법 (A Dynamic Approach to Extract the Original Semantics and Structure of VM-based Obfuscated Binary Executables)

  • 이성호;한태숙
    • 정보과학회 논문지
    • /
    • 제41권10호
    • /
    • pp.859-869
    • /
    • 2014
  • 최근 몇 년 동안, 난독화 기술은 악성 코드를 보호하기 위해 악용되어 큰 위협이 되고 있다. 특히, 가상 머신 기반으로 난독화된 악성 코드의 경우, 원본 프로그램이 직접적으로 드러나지 않고 가상머신의 의미와 원본 프로그램의 의미가 함께 수행되므로 분석하기 어렵다. 이러한 위협에 대응하기 위하여, 가상 머신 기반으로 난독화된 프로그램을 분석하는 동적 분석 기반의 프레임워크를 제안한다. 첫째, 난독화된 실행파일의 동적 실행 트레이스를 추출한다. 둘째, 동적 실행 트레이스를 중간언어로 변환하고 동적 제어 흐름 그래프를 이용하여 가상 머신의 구조를 추출한다. 결과적으로, 추출된 가상 머신 구조를 이용하여 원본 프로그램의 의미를 추출한다. 본 논문은 최신 상용 난독화 도구로 난독화된 실행파일에서 원본 프로그램을 추측할 수 있는 방안을 제시한다. 개발된 도구는 가상 머신 기반으로 난독화된 프로그램을 이해하고 프로그램 분석 기법을 적용하는 데 활용될 수 있으며 추출된 원본 프로그램의 요약 의미를 이용하여 추가적인 분석을 적용할 수 있을 것으로 기대한다.

순차 패턴을 이용한 XML문서의 유사성 계산 방법 분석 (Korea Information Science Society)

  • 이원철;이상민
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.232-234
    • /
    • 2004
  • XML 문서의 요소는 의미적인 정보와 트리기반의 구조적인 정보를 포함하고 있기 때문에 요소의 구조적인 유사성이 곧 XML 문서의 유사성으로 연구되어 왔다. 그러나 구조적이고 순차적인 유사성만을 고려한 순차패턴 유사성 검색 방법은 의미적인(sementic) 유사성을 제대로 반영을 할 수가 없다. 이것은 정보 검색에 있어 재현율(recall)을 낮을 수밖에 없는 원인을 제공한다. 따라서 본 논문에서는 기존에 사용되었던 순차패턴을 기반으로 한 유사성의 계산 방법과 각각의 연구 방법이 의미적인 유사성에 대하여 한계가 있음을 찾아보았다.

  • PDF

비디오스트리밍 서비스를 위한 의미기반 비디오 표현 및 저장 기법 (Semantic-Based Video Representation and Storing Techniques for Video Streaming Services)

  • 이석룡
    • 한국경영과학회:학술대회논문집
    • /
    • 대한산업공학회/한국경영과학회 2004년도 춘계공동학술대회 논문집
    • /
    • pp.505-509
    • /
    • 2004
  • 본 논문에서는 비디오 스트림 서버에서 의미 기반 검색을 가능하게 하기 위하여 대용량 스트림 데이터를 효과적으로 표현하고 저장하는 기법을 제시한다. 비디오 스트림 내의 각 프레임을 다차원 공간상의 점으로 사상함으로써 비디오 스트림은 다차원 시퀀스(multidimensional sequence)로 표현되고, 이 시퀀스는 다시 비디오 세그먼트로 분할된다. 분할된 세그먼트로부터 정적인 특성과 연속된 프레임의 움직임을 나타내는 트랜드 벡터(trend vector)등의 의미 정보를 추출하여 모델링 함으로서 스트림 데이터를 효과적으로 표현한다. 또한 제안된 기법은 효율적인 검색을 위하여 비디오 세그먼트를 인덱싱하고 저장하는 방법을 제공함으로써 공간 사용의 효율성을 높이고 신속한 검색을 가능하게 한다.

  • PDF

U-WIN(사용자어휘지능망) 기반의 의미적 정보검색과 KISTI-STA (Semantic Information Retrieval based on User-Word Intelligent Network(U-Win) and KISTI-STA)

  • 최호섭;윤화묵;옥철영
    • STIMA Bulletin
    • /
    • 통권6호
    • /
    • pp.27-34
    • /
    • 2007
  • 정보검색서비스는 '사용자가 얼마나 편리하게 검색할 수 있는가'와 '검색 결과에 얼마나 만족하는가'가 중요한데, 이는 정보검색 기술 개발에서 가장 중요하게 고려해야 할 사항이다. 본고는 과학기술 지식정보를 대상으로, 어휘망과 온톨로지적 성격을 가지고 있는 U-WIN을 기반으로 의미적인 정보검색 서비스가 가능하도록 하기 위하여, 한국과학기술정보연구원(KISTI)에서 개발 중인 U-WIN을 이용한 의미적 정보검색 기술과 시범서비스인 KISTI-STA를 소개한다.

  • PDF

인터넷 정보검색 인터페이스를 위한 한국어 의미분석 (Semantic analysis of Korean for web-search interface)

  • 권혜진;노현철;이근배;이종혁
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1996년도 제8회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.189-195
    • /
    • 1996
  • 본 논문에서는 자연어를 통한 웹 정보검색 모델을 제시하고, 이를 위한 한국어 처리 방법을 소개한다. 자연어 질의에 대해 범주 문법에 기반한 구문 중심의 의미 파싱을 통해 QLF(quasi logical form)을 생성하며, 의미의 선택 제약 방법을 통해 모호성을 제거한다. QLF의 담화 처리를 통해 session 기반의 웹 검색을 실현할 수 있는 방법을 제안한다.

  • PDF

마커 전파를 이용한 문장간 추론 (Marker Passing based Intersentential Reasoning)

  • 엄익태
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1996년도 제8회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.377-385
    • /
    • 1996
  • 여러 가지 의미를 갖고 있는 단어의 올바른 해석은 통사론적, 의미론적, 화용론적 지식을 요구하고 있다. 특히 본 논문에서 다루고자 하는 과제는 의미상 연결되어 있는 두 문장의 효과적인 해석을 통해 다의 단어의 애매성을 처리하는 방법에 관한 것이다. 이를 위해서 마커 전파를 근간으로 하는 메모리 기반 파싱에 이완법(relaxation)을 적용하여 양자의 유기적인 결합을 통한 확장된 메모리 기반 파싱 방법을 제안하고자 한다. 이 방법은 마커 전파가 제공하는 효율성을 유지하며, 이완법이 제공하는 효과성을 추구하고 있다.

  • PDF

상호정보량과 복합명사 의미사전에 기반한 동음이의어 중의성 해소 (Homonym Disambiguation based on Mutual Information and Sense-Tagged Compound Noun Dictionary)

  • 허정;서희철;장명길
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제33권12호
    • /
    • pp.1073-1089
    • /
    • 2006
  • 자연언어처리의 목적은 컴퓨터가 자연어를 이해할 수 있도록 하여, 인간에게 다양한 정보를 정확하고 빠르게 전달할 수 있도록 하고자 하는 것이다. 이를 위해서는 언어의 의미를 정확히 파악하여야 하는데, 어휘 의미 중의성 해소가 필수적인 기술이다. 본 연구는 상호정보량과 기 분석된 복합명사 의미사전에 기반한 동음이의어 의미 중의성 해소를 위한 기술을 소개한다. 사전 뜻풀이를 이용하는 기존 기술들은 어휘들간의 정확한 매칭에 의존하기 때문에 자료 부족 현상이 심각하였다. 그러나, 본 연구에서는 어휘들간의 연관계수인 상호정보량을 이용함으로써 이 문제를 완화시켰다. 또한, 언어적인 특징을 반영하기 위해서 상호정보량을 가지는 어휘 쌍의 비율 가중치, 의미 별 비율 가중치와 뜻풀이의 길이 가중치를 사용하였다. 그리고, 복합명사를 구성하는 단일명사들은 서로의 의미를 제약한다는 것에 기반하여 고빈도 복합명사에 대해서 의미를 부착한 의미사전을 구축하였고, 이를 동음이의어 중의성 해소에 활용하였다. 본 시스템의 평가를 위해 질의응답 평가셋의 200 여 개의 질의와 정답단락을 대상으로 동음이의어 의미 중의성 해소 평가셋을 구축하였다. 평가셋에 기반하여 네 유형의 실험을 수행하였다. 실험 결과는 상호 정보량만을 이용하였을 때 65.06%의 정확률을 보였고, 가중치를 활용하였을 때 85.35%의 정확률을 보였다. 또한, 복합명사 의미분석 사전을 활용하였을 때는 88.82%의 정확률을 보였다.

기계가독형사전과 코퍼스에서 추출한 의미정보를 이용한 명사열의 의미해석 (Interpretation of Noun Sequence using Semantic Information Extracted from Machine Readable Dictionary and Corpus)

  • 이경순;김도완;김길창;최기선
    • 인지과학
    • /
    • 제12권1_2호
    • /
    • pp.11-24
    • /
    • 2001
  • 명사열의 의미해석은 명사들 사이의 의미적인 관계를 찾는 것으로, 한국어에서 명사열의 출현은 보편적인 현상이며, 그 생성 또한 비교적 자유롭다. 본 논문에서는 기계가독형사전과 코퍼스로부터 명사 사이의 <목적>, <물건-재료>, <원인>등과 같은 의미관계 정보를 자동으로 추출한다. 추출한 의미관계정보에 기반하여 의미망을 구축하고. 의미 정보와 서술성 명사의 하위 범주 정보를 이용하여 명사열을 해석하는 방법을 제안하였다. 본 논문에서는 명사열의의미 해석 대상을 한국어 명사열의 대부분의 차지하는 수싲 명사+핵심명사 형태로 한정하였다. 기계가독형사전과 코퍼스로부터 추출한 의미정보와 하위 범주를 이용한 명사열의미 해석은 기존의 기계가독형사전 기반 의미 해석보다 정확률 +40.30%,적용률+12.73%의 성능 향상을 나나태었다.

  • PDF

대용량 소셜 데이터의 의미 분석을 위한 MapReduce 기반의 분석 모듈 설계 및 구현 (Design and Implementation of an Analysis module based on MapReduce for Large-scalable Social Data)

  • 이혁주;김명진;이한구;윤효근
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(B)
    • /
    • pp.357-360
    • /
    • 2011
  • 최근 인터넷과 통신기술, 특히 모바일과 관련된 기술의 급속한 발전으로 소셜 커뮤니케이션 수단으로 대표되는 SNS(Social Networking Service)가 중요한 이슈로 부각되어지고 있다. SNS 서비스 제공시 중요하게 고려되어져야 할 사항은 정확하고 의미 있는 데이터를 통해서 사용자가 원하고 관심 있는 분야의 정보를 어떻게 제공할 것인가에 초점이 맞춰져 있어야 한다. 그러나 최근 폭발적으로 증가되어지고 있는 소셜 데이터 때문에 사용자는 의미 분석이 정확하게 이루어지지 않은 신뢰성이 결여된 소셜 커뮤니케이션 서비스를 제공받고 있다. 이러한 소셜데이터 분석의 문제점을 해결하기 위해서 본 논문에서는 소셜 네트워크 서비스에 필요한 데이터를 수집하고, 클라우드 컴퓨팅 환경에서 수집된 대용량 SNS 데이터의 의미를 분석 할 수 있는 MapReduce 기반의 분석 모듈의 구조를 제안하였다. 제안한 모듈은 의미 분석에 필요한 소셜 데이터를 수집하는 수집 기능과 수집된 소셜데이터의 의미 분석을 수행하는 분석 기능을 포함하고 있다. 수집 기능은 SNS에서 생성되는 텍스트 형태의 데이터를 수집하고 MapReduce를 통해서 데이터를 분석하기 쉽게 적절한 크기로 생성된 파일을 분할한다. 수집된 소셜 데이터의 의미 분석은 기존 TF-IDF 방식에 개선된 Weighted-MINMAX 적용한 알고리즘을 통해서 구현하였다. 개선된 알고리즘은 단어의 중요도를 평가하고, 중요도가 높은 단어로 구성된 의미정보 제공 서비스를 지원한다. 시스템의 성능 평가를 위해서 노드별 데이터 처리시간과 추출 키워드의 정확도를 측정하였다.

선형논리에 기반한 불확실성 데이터베이스 의미론 (Semantics of Uncertain Databases based on Linear Logic)

  • 박성우
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권2호
    • /
    • pp.148-154
    • /
    • 2010
  • 불확실성 데이터베이스의 의미론 정의는 보통 주어진 불확실성 데이터베이스를 여러 개의 관계형데이터베이스로 변환하는 산술적 접근방법을 취한다. 이 논문에서는 불확실성데이터베이스를 논리이론으로 변환하는 논리적 접근방법을 통해서 불확실성 데이터베이스의 의미론을 정의하고자 한다. 본 논문에서 제안하는 의미론의 가장 특징적인 면은 기존의 논리적 접근방법에서 사용해온 명제논리 대신에 선형논리를 논리적 근간으로 이용한다는 점이다. 선형논리는 논리식을 불변진리가 아닌 소비가능한 자원으로 해석하기 때문에 불확실성 데이터베이스의 의미론을 정의하는데 적합하다. 본 논문의 핵심 결과는 선형논리에 기반한 불확실성 데이터베이스의 의미론이 산술적 접근방식에서 설명하는 불확실성 데이터베이스의 의미론과 동등하다는 것이다.