• 제목/요약/키워드: URL 패턴

검색결과 27건 처리시간 0.023초

Web 문서의 효율적인 실시간 검색을 위한 잡음 제거와 패턴 정합 기법 (Noise Removal and Pattern Matching for Efficient Meta-Search of Web Documents)

  • 강대기;이제선;함호상
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (2)
    • /
    • pp.132-134
    • /
    • 1998
  • 웹 상의 메타 검색 엔진, Push 프로그램 그리고 에이전트와 같은 웹 기반 응용 프로그램들은 웹 문서의 취득과 자동 필터링에 대한 능력을 필요로 한다. 이를 위한 인터페이스의 지식들은 대부분 코드 내에서 ad-hoc으로 구현되어 왔다. 본 논문에서는 취득된 웹 문서를 전처리하고 원하는 정보를 추출하기 위한 방법을 제시하고, 웹 상위 신문 기사에 대한 검색으로 실험해 보았다. 검색 시스템은 웹 문서의 전처리 과정을 통해 필요한 정보에만 집중할 수 있고, 아주 적은 양의 일반화된 지식을 토대로 원하는 정보를 용이하게 찾을 수 있었으며, 또한 웹 문서의 형식이 바뀌더라도 크게 영향을 받지 않으며, 새로운 웹사이트의 추가도 용이하였다. 본 논문의 방법으로 구현된 신문 기사 검색 시스템은, URL과 아주 적은 양의 지식만으로도, 10 개의 신문 웹사이트에서 문서를 가져와 효과적으로 해석할 수 있었다. 본 논문의 방법은 메타 검색 엔진이나, 잡지나 신문 기사 정보의 푸쉬(Push) 솔루션, 또는 상품 정보 검색 시스템 등의 설계에 활용될 수 있다.

  • PDF

유전자 알고리즘을 이용한 KeyGraph 알고리즘의 데이터 분할 (Sentence segmentation of KeyGraph using genetic algorithm)

  • 이영설;조성배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 가을 학술발표논문집 Vol.34 No.2 (C)
    • /
    • pp.352-356
    • /
    • 2007
  • 키그래프는 데이터 패턴 속에서 인간의 의사결정이나 미래에 닥쳐올 변화에 영향을 주지만 자주 발생하지 않는 희소성이 있는 사건을 발견하기 위한 알고리즘이다. 키그래프는 지진예측, 논문, 파일탐색, 그리고 중요한 URL 추출 등에 이용되었다. 데이터 분할을 통한 클러스터의 형성은 키그래프의 성능에 가장 큰 영향을 끼치는 요소 중의 하나이다. 본 논문에서는 유전자 알고리즘을 이용하여 키그래프의 성능을 향상시킬 수 있는 최적의 데이터 분할을 찾아내는 방법을 제안한다. 제안한 방법의 가능성을 보여주기 위하여 모바일 기기 사용자로부터 수집한 방문 장소 데이터에 제안하는 방법을 적용하여 키그래프의 성능이 향상되는 것을 보인다.

  • PDF

신조어 자동 추출 방법론과 신어 조사 도구의 개발 (Methodology and Implementation of Detecting Tool for New Words Occurring in Korean Document)

  • 이상곤
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2009년도 제21회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.271-276
    • /
    • 2009
  • 신조어 조사용 프로그램은 웹에 실시간으로 등록되는 언론 기사를 수집하는 웹 에이전트를 개발하여 텍스트를 추출하고, 간단한 어휘 분석을 통하여 국어사전에 등록된 표제어와 이미 연구자가 발견한 기존의 신조어를 제외하고, 현대의 사회상을 잘 표현하는 새로 생성된 신조어를 추출하는 작업을 하는 도구이다. 인터넷의 언론 사이트에서 규칙적인 URL 패턴을 발견하고 뉴스 기사를 수집한다. HTML 소스 분석을 통하여 언론 기사만을 추출하여 국어 전공자가 신어를 찾아내는 작업을 도와주는 조사 도구를 설계하고 구현하였다.

  • PDF

언론 기사에 나타난 신(조)어 조사 도구의 설계 및 구현 (Design and Implementation of Detecting Tool for New Word in Korean Journal Articles)

  • 송인성;정희석;이상곤;이래호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 춘계학술발표대회
    • /
    • pp.114-117
    • /
    • 2009
  • 신조어 조사용 프로그램은 웹에 실시간으로 등록되는 언론 기사를 수집하는 웹 에이전트를 개발하여 텍스트를 추출하고, 간단한 어휘 분석을 통하여 국어사전에 등록된 표제어와 이미 연구자가 발견한 기존의 신조어를 제외하고 새롭게 생성된 신조어를 추출하는 작업을 하는 도구이다. 인터넷의 언론 사이트에서 규칙적인 URL 패턴을 발견하고 뉴스 기사를 수집한다. HTML 소스 분석을 통하여 언론 기사만을 추출하고 이 기사에서 사전의 표제어와 기존에 조사된 신어를 제외하여 국어 전공자가 신어를 찾아내는 작업을 하는데 사용하는 시스템을 설계하고 구현하였다.

WhiteList 기반의 악성코드 행위분석을 통한 악성코드 은닉 웹사이트 탐지 방안 연구 (Research on Malicious code hidden website detection method through WhiteList-based Malicious code Behavior Analysis)

  • 하정우;김휘강;임종인
    • 정보보호학회논문지
    • /
    • 제21권4호
    • /
    • pp.61-75
    • /
    • 2011
  • 최근 DDoS공격용 좀비, 기업정보 및 개인정보 절취 등 각종 사이버 테러 및 금전적 이윤 획득의 목적으로 웹사이트를 해킹, 악성코드를 은닉함으로써 웹사이트 접속PC를 악성코드에 감염시키는 공격이 지속적으로 증가하고 있으며 은닉기술 및 회피기술 또한 지능화 전문화되고 있는 실정이다. 악성코드가 은닉된 웹사이트를 탐지하기 위한 현존기술은 BlackList 기반 패턴매칭 방식으로 공격자가 악성코드의 문자열 변경 또는 악성코드를 변경할 경우 탐지가 불가능하여 많은 접속자가 악성코드 감염에 노출될 수 밖에 없는 한계점이 존재한다. 본 논문에서는 기존 패턴매칭 방식의 한계점을 극복하기 위한 방안으로 WhiteList 기반의 악성코드 프로세스 행위분석 탐지기술을 제시하였다. 제안방식의 실험 결과 현존기술인 악성코드 스트링을 비교하는 패턴매칭의 MC-Finder는 0.8%, 패턴매칭과 행위분석을 동시에 적용하고 있는 구글은 4.9%, McAfee는 1.5%임에 비해 WhiteList 기반의 악성코드 프로세스 행위분석 기술은 10.8%의 탐지율을 보였으며, 이로써 제안방식이 악성코드 설치를 위해 악용되는 웹 사이트 탐지에 더욱 효과적이라는 것을 증명할 수 있었다.

스미싱 공격 방지를 위한 클라우드 메시징 서비스 (Cloud Messaging Service for Preventing Smishing Attack)

  • 박효민;김완석;강소정;신상욱
    • 디지털융복합연구
    • /
    • 제15권4호
    • /
    • pp.285-293
    • /
    • 2017
  • 스마트 디바이스에 대한 악의적인 공격들이 빠르게 진화하고 있고, 이들 공격에 대해 스마트 디바이스를 적절하게 보호하는 것은 매우 중요한 이슈로 부각되고 있다. 특히, 스미싱 공격은 스마트 폰에서 가장 중요한 위협들 중의 하나로 주목되고 있다. 이 논문에서는 스미싱 공격의 위험으로부터 사용자를 근본적으로 보호할 수 있는 클라우드 서비스를 제안한다. 제안된 클라우드 메시징 서비스는 사용자 스마트 디바이스에서 URL을 포함한 텍스트 메시지들을 필터링하여 클라우드 서버에 의해 제공되는 가상 머신을 통해 필터링된 메시지들을 확인하고 관리할 수 있는 클라우드 서비스를 제공한다. 기존의 스미싱 방지 기법들이 이미 알려진 패턴의 악성코드에 대해서만 보호하거나, 오탐(FP) 또는 미탐(FN) 등의 오류 가능성을 내포하고 있지만, 제안 기법은 URL을 포함하고 있는 모든 문자 메시지들을 자동적으로 필터링하여 클라우드 서버 상의 저장공간에 저장하고 확인 및 관리하기 때문에 스마트 디바이스에서 스미싱 공격에 의한 멀웨어(악성코드)의 설치를 완벽하게 차단할 수 있다.

고준위 방사성 폐기물 지질처분을 위한 해외 선진국의 심부 지하수 환경 연구동향 분석 및 시사점 도출 (Status and Implications of Hydrogeochemical Characterization of Deep Groundwater for Deep Geological Disposal of High-Level Radioactive Wastes in Developed Countries)

  • 최재훈;유순영;박선주;박정훈;윤성택
    • 자원환경지질
    • /
    • 제55권6호
    • /
    • pp.737-760
    • /
    • 2022
  • 고준위 방사성 폐기물(High-level radioactive waste; HLW)의 지질처분을 위해서는 심부 지하 환경에 대한 이해가 선행되어야 하며, 이는 지질학적, 수리지질학적, 지구화학적, 지질공학적 조사를 통해 가능하다. 우리나라는 HLW의 지질처분을 계획하고 있으나, 심부 지하 환경의 지구화학적 특성에 관한 연구가 부족한 편이다. 이에 본 논문에서는 지질처분 부지 선정을 위한 지구화학적 조사를 중심으로 선진국의 심부 지하수 연구 동향을 살펴봄으로써 앞으로 국내 수리지구화학 분야의 연구 과제를 도출하는데 참고하고자 하였다. 해외 8개 국가(미국, 캐나다, 핀란드, 스웨덴, 프랑스, 독일, 일본, 스위스)의 심부 지하 환경 조사 방법 및 결과와 함께 지질처분 부지 결정 과정과 향후 연구 계획을 살펴본 결과, 해외 선진국에서는 심부 지하 환경의 지구화학적 특성화를 위해 지하수 및 난대수층 내 간극수의 수화학과 동위원소(예: SO42-34S, 18O, DIC의 13C, 14C, H2O의 2H, 18O), 균열 충전광물(fracture-filling minerals), 유기물, 콜로이드, 산화-환원 지시자(예: Eh, Fe2+/Fe3+, H2S/SO42-, NH4+/NO3-) 등을 조사하고 있으며, 이들 지구화학 자료의 통합 해석을 통해 해당 심부 환경이 지질처분에 적합한지를 평가하였다. 국내의 경우, 인공신경망을 이용한 Self-Organizing Map(자기조직화 지도), 다변량 통계 기반 M3 모델링(지하수 혼합 모델), 반응-경로 모델(reaction path model) 등을 이용하여 심부 지하수의 수화학적 유형 분류 및 진화 패턴 규명, 천부 지하수 혼합 영향, 균열 충전광물과 지하수화학 사이의 관계를 규명한 바 있다. 그러나 지질처분 부지를 선정하는데 있어 과학적 근거를 확보하기 위해 중요한 기타 지구화학 자료(예: 동위원소, 산화-환원 지시자, 용존유기물)가 매우 부족한 현실이며, 따라서 최적의 지질 처분지를 찾기 위해서는 지역별/유형별 심부 지하수에 대한 지구화학적 자료 구축이 요구된다.