• 제목/요약/키워드: 텍스트 수집

검색결과 697건 처리시간 0.028초

교통사고자료 관리 및 분석 기법의 개선방안에 관한 고찰 (A Study on management and analysis of traffic accidents)

  • 유지연;전형섭;임승현;조기성
    • 한국공간정보시스템학회:학술대회논문집
    • /
    • 한국공간정보시스템학회 2005년도 GIS/RS 공동 춘계학술대회
    • /
    • pp.401-406
    • /
    • 2005
  • 교통안전 선진국에서는 사고 자료의 수집, 저장, 공유와 관련된 도로교통사고 자료 관리 체계를 합리화하기 위해 부단히 노력하고 있으나, 우리나라에서는 이미 오래 전에 만들어진 도로교통사고 자료양식을 수정 없이 사용해오고 있으며, 정확한 교통사고 발생지점 및 교통사고 분석 자료를 체계적으로 관리하지 못하고 있어 아직 후진성을 면치 못하고 있는 것이 현실이다. 본 연구는 교통사고 자료를 지형공간정보체계(Geographic Information System : GIS) 기반으로 구축하여 기존에 텍스트 형태의 자료 수집이 아닌 PDA를 이용하여 실시간으로 사고 자료를 표준 양식에 맞게 변환하여 저장 및 사고 정보를 관리할 수 있으며, 공간데이터 특수성과 연계하여 사고원인에 대한 지리적 분석 데이터로 표출하는 통합 관리시스템 개발에 관한 연구를 수행하였다.

  • PDF

소비자 분석을 위한 감성사전 모델링 (Sentiment lexicon modeling for consumer analysis)

  • 이재웅;윤현노;문남미
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 춘계학술발표대회
    • /
    • pp.850-853
    • /
    • 2017
  • 본 논문은, 크롤링을 통해 얻은 비정형 데이터를 'Python'의 'KoNLPy' 라이브러리를 사용해 형태소 분석한 후 텍스트 마이닝을 통한 감성사전 구축을 목표로 하고 있으며, 형태소들의 빈도수를 기반으로 가중치로 두어 선별된 단어들을 이용해 긍정과 부정으로 나누어 카테고리화 한다. 이후, 선별한 카테고리에 단어의 극성을 판단하여 감성사전을 모델링한다. 실험을 위하여, 온라인 쇼핑몰 리뷰를 크롤링하여 비정형 데이터를 수집하고, 수집한 데이터를 분석, 가공 과정을 거쳐 정형화된 단어를 추출한다. 그 후에, 리뷰에 자주 사용되는 단어를 바탕으로 카테고리를 구성하였다. 구성된 카테고리 별로 단어의 극성을 판단하여 소비자 성향을 분석한 결과, 단순히 긍정과 부정을 표현하는 범용 감성사전보다 더 세분화된 감성 사전을 구축 할 수 있었다.

Afreeca 인터넷 방송 서비스에서의 사용자 행동 분석 (User behaviors in "Afreeca" Internet Broadcast Service)

  • 박용덕;박건우;권태경;최양희
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2008년도 한국컴퓨터종합학술대회논문집 Vol.35 No.1 (D)
    • /
    • pp.297-301
    • /
    • 2008
  • 광대역 통신망의 발달과 더불어 정보통신 및 디지털 영상 기기의 대중화로 인해 텍스트 및 사진 위주의 정보 전달과 달리 소리와 영상을 기반으로 한 멀티미디어 정보 전달이 우리 생활 속의 일부로 자리 잡고 있다. 이러한 멀티미디어 정보 전달에 있어 트래픽 분산을 위한 P2P(Peer to Peer) 방식의 실시간 스트리밍 서비스에 대해 많은 연구가 있었다. 본 논문에서는 "사용자"를 중심에 두고 사용자의 서비스 이용에 대한 패턴을 파악하기 위해 사용한 "Afreeca" 인터넷 방송서비스와 사용자 패턴 수집 방법에 대해 설명한 다음, 수집된 결과를 이용하여 컨텐츠 특성별 사용자 패턴의 차이와 특징을 분석해 보았다.

  • PDF

차세대 이동통신망에서 상황인식 서비스 (Context-Aware Services in Next Generation Mobile Communication Networks)

  • 김재호;배정숙;김성희
    • 전자통신동향분석
    • /
    • 제19권3호통권87호
    • /
    • pp.32-40
    • /
    • 2004
  • 상황정보(context information)는 사용자의 요구와 주변 상황이 수시로 변화하는 이동통신 환경에서 더욱 중요하게 활용된다. 따라서, 차세대 이동통신 시스템의 서비스는 음성, 텍스트, 멀티미디어 서비스의 고도화에 이어 일상 곳곳에 편재된 센서 및 컴퓨터들이 수집한 각종 환경정보를 효과적으로 상호 공유하여 사용자 및 주변 환경의 상황(context)을 알아내고 그에 맞는 다양한 정보에 근거하여 자발적으로 서비스를 제공하는 상황인식(context-aware) 특징을 가지게 될 것이다. 이러한 상황인식 서비스를 가능하게 하기 위해서는 사용자 및 사물 등의 객체를 인식하고, 이들의 현 상태에 따른 상황정보를 수집하여 서비스에 적응하는 기술 등이 필수적이다. 본 논문에서는 IMT-2000 이후의 차세대 이동통신 시스템의 진화방향을 상황인식 서비스 제공 관점에서 살펴보고, 상황인식 서비스를 위한 관련 기술과 차세대 이동통신 환경에서 상황인식 서비스가 어떻게 제공될 수 있을지를 살펴본다.

신조어 자동 추출 방법론과 신어 조사 도구의 개발 (Methodology and Implementation of Detecting Tool for New Words Occurring in Korean Document)

  • 이상곤
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2009년도 제21회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.271-276
    • /
    • 2009
  • 신조어 조사용 프로그램은 웹에 실시간으로 등록되는 언론 기사를 수집하는 웹 에이전트를 개발하여 텍스트를 추출하고, 간단한 어휘 분석을 통하여 국어사전에 등록된 표제어와 이미 연구자가 발견한 기존의 신조어를 제외하고, 현대의 사회상을 잘 표현하는 새로 생성된 신조어를 추출하는 작업을 하는 도구이다. 인터넷의 언론 사이트에서 규칙적인 URL 패턴을 발견하고 뉴스 기사를 수집한다. HTML 소스 분석을 통하여 언론 기사만을 추출하여 국어 전공자가 신어를 찾아내는 작업을 도와주는 조사 도구를 설계하고 구현하였다.

  • PDF

빅데이터 기반의 오피니언 마이닝을 이용한 기업 가치 평가 시스템 개발 (Developing Corporate Valuation System with Opinion Mining Based on Big Data)

  • 이정태;천민아;임상우;전병석;김재훈;한영우
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2013년도 제25회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.126-128
    • /
    • 2013
  • 빅데이터(Big Data)는 현재 생산되고 있는 데이터 중 그 규모가 방대하고, 생성 주기가 짧으며, 수치 데이터 뿐 아니라 텍스트 이외의 멀티미디어 등 비정형화된 데이터를 포함하는 대규모 데이터를 말한다. 빅데이터를 처리하여 가치 있는 정보를 추출하는 방법에 관한 연구가 활발하게 진행되고 있으며, 이를 바탕으로 빅데이터가 다양한 분야에서 활용되고 있다. 현재 국내 주식시장에서도 빅데이터를 이용하여 기업의 투자에 활용하고 있다. 이 논문에서는 인터넷의 증권과 관련된 뉴스를 수집하여 수집된 뉴스와 주가 지수를 이용하여 기업 뉴스 평가 시스템을 개발하는 방법을 제안한다.

  • PDF

모바일 소셜 네트워크를 이용한 상황 공유 시스템 (A Context Sharing System using Mobile Social Networks)

  • 오근현;박한샘;조성배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2010년도 한국컴퓨터종합학술대회논문집 Vol.37 No.1(B)
    • /
    • pp.222-226
    • /
    • 2010
  • 최근 모바일 기기가 보급됨에 따라 모바일 기기를 활용한 상황 공유 시스템에 대한 관심이 커지고 있다. 상황공유를 다룬 기존 연구들은 대부분 위치를 비롯한 저수준 상황만을 공유하며 고수준 상황인 행동과 감정 공유를 효율적으로 지원하지 않고 있으며 개인정보보호 단계를 수동으로 설정해주어야하는 단점이 있다. 본 논문에서는 모바일 기기의 센서들로부터 수집되는 저수준 상황과 행동, 감정 등의 고수준 상황을 함께 수집하였으며 베이지안 네트워크를 이용하여 설계한 소셜 네트워크를 기반으로 행동, 감정, 그리고 관계를 효과적으로 보여주도록 하였다. 또한 관계정보를 바탕으로 개인정보보호 단계를 자동으로 설정해주어 친밀한 사용자에게만 자신의 상황을 공유할 수 있는 상황 공유 시스템을 설계 구축하였다. 실험에서는 실제로 구성된 모바일 소셜 네트워크에서의 관계를 바탕으로 상황 정보를 공유하는 폰북과 맵브라우저로 구성된 컨텍스트뷰어 어플리케이션을 통해 제안하는 시스템의 유용성을 보였다.

  • PDF

온라인 커뮤니티상에 나타난 여성혐오 현상 분석 (Analyzing the phenomenon of misogyny in online community)

  • 이지현;우지영
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2019년도 제60차 하계학술대회논문집 27권2호
    • /
    • pp.27-28
    • /
    • 2019
  • 본 논문에서는 한국 사회에 특유의 폭력성과 선정성으로 인해 큰 충격을 주고 있는 인터넷 커뮤니티 사이트 '일간 베스트' 글에 나타난 욕설과 여성 혐오에 대해 분석하고자 한다. 데이터는 일베 게시판에 올라온 게시글 2,000개를 웹 크롤링하여 수집하였으며, 수집한 게시글에 게임 내 금칙어 리스트와 여성 지칭어 사전을 기반으로 욕설 여부와 여성 지칭어를 태깅하였다. 태깅하여 분석한 결과 여성 지칭어를 사용한 게시글에는 욕설을 사용하는 글이 전체의 60.52%로 많았으며 욕설을 사용하지 않은 게시글에도 범행, 살해, 김치녀 등의 부정적인 단어가 많은 것을 볼 수 있었다.

  • PDF

언론 기사에 나타난 신(조)어 조사 도구의 설계 및 구현 (Design and Implementation of Detecting Tool for New Word in Korean Journal Articles)

  • 송인성;정희석;이상곤;이래호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 춘계학술발표대회
    • /
    • pp.114-117
    • /
    • 2009
  • 신조어 조사용 프로그램은 웹에 실시간으로 등록되는 언론 기사를 수집하는 웹 에이전트를 개발하여 텍스트를 추출하고, 간단한 어휘 분석을 통하여 국어사전에 등록된 표제어와 이미 연구자가 발견한 기존의 신조어를 제외하고 새롭게 생성된 신조어를 추출하는 작업을 하는 도구이다. 인터넷의 언론 사이트에서 규칙적인 URL 패턴을 발견하고 뉴스 기사를 수집한다. HTML 소스 분석을 통하여 언론 기사만을 추출하고 이 기사에서 사전의 표제어와 기존에 조사된 신어를 제외하여 국어 전공자가 신어를 찾아내는 작업을 하는데 사용하는 시스템을 설계하고 구현하였다.

스마트폰 환경에서 디지털 포렌식 분석 사례 연구 (Digital Forensic Analysis Case study on Smartphone)

  • 이기욱;최옥경;홍만표
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 추계학술발표대회
    • /
    • pp.765-767
    • /
    • 2011
  • IT 와 비즈니스가 융합화 되고 정보가 디지털화 됨에 따라 그에 대한 저장매체도 점점 더 다양해지고 있다. 그 중 이동성이 편리하고 휴대하기 간편한 스마트폰을 활용하여 개인 정보를 주고 받고 이를 이용한 비즈니스가 현재 활발히 진행되고 있다. 이러한 소셜 네트워크 서비스 이용이 급격히 증가함에 따라 개인 정보 보안에 대한 중요성은 점점 더 강조 되고 있는 실정이다. 본 연구에서 제안하는 디지털 포렌식 분석 방법을 이용하면 스마트폰에서 지원하는 서비스 형태에 따라 텍스트, 이미지, 동영상 등의 개인 정보를 수집 및 분석이 가능하다. 또한 디지털 포렌식의 관점에 따라 스마트폰 에서 사용되고 있는 애플리케이션의 로그 정보를 수집 및 분석함으로써 스마트폰의 저장 장치에 남겨진 기록들을 훼손 없이 그대로 보존시키고 디지털 증거 자료로 활용이 가능해 사이버 범죄에 대한 신속한 해결이 가능하다.