• 제목/요약/키워드: Web Text Analysis

검색결과 281건 처리시간 0.022초

온라인 빅 데이터 분석을 활용한 스페셜티 커피 속성에 대한 탐색적 연구 (An Exploratory Study on Key Attributes of Specialty Coffee by Online Big Data Analysis)

  • 임미리;윤대열;류기환
    • 문화기술의 융합
    • /
    • 제6권3호
    • /
    • pp.275-282
    • /
    • 2020
  • 최근 커피분야에 대한 소비자의 높아진 인식과 가격대 품질보다 한단계 나아가 심리적 만족에 비중을 두는 커피문화의 변화로 고품질 스페셜티 커피에 대한 관심이 높아지고 있다. 커피를 즐기는 방식이나 맛과 향 등을 중요하게 생각하는 하나의 문화로서 기호에 맞는 커피를 제공받고자하는 고객이 늘어남에 따라 스페셜티 커피전문점의 수도 증가하고 있으며 제공되는 커피의 품질 또한 높아지고 있다. 이에 본 연구는 스페셜티 커피의 주요 속성을 분석하고, 스페셜티 커피전문점에 필요한 마케팅 시스템을 구축하는 것에 목적을 두었다. 연구 방법으로 온라인 빅 데이터 분석을 통한 텍스트 마이닝을 실시하여 스페셜티 커피의 속성을 형성하는 요소들을 추출하고 영향의 정도를 분석하였다. 연구결과 커피의 맛과 원두, 바리스타와 관련된 단어들이 스페셜티커피의 속성에 중심적인 역할을 하는 것으로 파악되었다.

웹 기반 멀티미디어 환경 교육 교수·학습 자료의 내용 및 유형 분석 (Analysis on contents and types of Web-based Multimeida Learning Materials for Environmental Education)

  • 차민정;소금현;심규철;여성희
    • 과학교육연구지
    • /
    • 제34권1호
    • /
    • pp.84-92
    • /
    • 2010
  • 본 연구에서는 유 초 중등 및 일반인을 대상으로 개발된 환경교육 교수 학습 자료의 유형과 내용을 분석하고, 또한 학교 급간별로 어떠한 특징이 있는지 분석하였다. 전반적으로 웹기반 멀티미디어 학습자료가 포함하고 있는 환경교육 내용 영역은 자연 환경 304건(22.1%), 환경 오염 250건(16.5%), 환경보전대책 187건(12.4%)으로 이들 영역에 치중되어 있었다. 교수 학습 자료 유형은 수업지도안(934건, 61.8%), 다큐멘터리(156건, 10.3%), 정보문자(128건, 8.5%) 등이 가장 높은 비중을 차지하고 있었다. 학교급간별 멀티미디어 교수-학습 자료를 분석한 결과 초등학교(796건, 35.3%)와 중학교(588건, 26.1%)에 치중되어 있는 것으로 나타났으며 일반인을 대상으로 하거나 고등학생을 대상으로 한 학습 자료는 부족한 것으로 나타났다. 세계적으로 환경교육의 내용이 전통적인 환경 오염 문제 중심에서 벗어나 지속가능 교육(ESSD)을 특히 강조하며, 그 외에 생태계, 인간과 자연과의 관계, 건전한 소비 등으로 확대되는 추세를 감안하여 시대적 요구를 반영한 다양하고 균형 있는 교육 자료가 개발될 필요가 있다.

  • PDF

빅데이터를 통한 소비자의 의복관리방식 트렌드 분석 (Trend Analysis on Clothing Care System of Consumer from Big Data)

  • 구영석
    • 한국의류산업학회지
    • /
    • 제22권5호
    • /
    • pp.639-649
    • /
    • 2020
  • This study investigates consumer opinions of clothing care and provides fundamental data to decision-making for oncoming development of clothing care system. Textom, a web-matrix program, was used to analyze big data collected from Naver and Daum with a keyword of "clothing care" from March 2019 to February 2020. A total of 22, 187 texts were shown from the big data collection. Collected big data were analyzed using text-mining, network, and CONCOR analysis. The results of this study were as follows. First, many keywords related to clothing care were shown from the result of frequency analysis such as style, Dryer, LG Electronics, Product, Customer, Clothing, and Styler. Consumers were well recognizing and having an interest in recent information related to the clothing care system. Second, various keywords such as product, function, brand, and performance, were linked to each other which were fundamentally related to the clothing care. The interest in products of the clothing care system were linked to product brands that were also naturally linked to consumer interest. Third, the keywords in the network showed similar attributes from the result of CONCOR analysis that were classified into 4 groups such as the characteristics of purchase, product, performance, and interest. Lastly, positive emotions including goodwill, interest, and joy on the clothing care system were strongly expressed from the result of the sentimental analysis.

전역 토픽의 지역 매핑을 통한 효율적 토픽 모델링 방안 (Efficient Topic Modeling by Mapping Global and Local Topics)

  • 최호창;김남규
    • 지능정보연구
    • /
    • 제23권3호
    • /
    • pp.69-94
    • /
    • 2017
  • 최근 빅데이터 분석 수요의 지속적 증가와 함께 관련 기법 및 도구의 비약적 발전이 이루어지고 있으며, 이에 따라 빅데이터 분석은 소수 전문가에 의한 독점이 아닌 개별 사용자의 자가 수행 형태로 변모하고 있다. 또한 전통적 방법으로는 분석이 어려웠던 비정형 데이터의 활용 방안에 대한 관심이 증가하고 있으며, 대표적으로 방대한 양의 텍스트에서 주제를 도출해내는 토픽 모델링(Topic Modeling)에 대한 연구가 활발히 진행되고 있다. 전통적인 토픽 모델링은 전체 문서에 걸친 주요 용어의 분포에 기반을 두고 수행되기 때문에, 각 문서의 토픽 식별에는 전체 문서에 대한 일괄 분석이 필요하다. 이로 인해 대용량 문서의 토픽 모델링에는 오랜 시간이 소요되며, 이 문제는 특히 분석 대상 문서가 복수의 시스템 또는 지역에 분산 저장되어 있는 경우 더욱 크게 작용한다. 따라서 이를 극복하기 위해 대량의 문서를 하위 군집으로 분할하고, 각 군집별 분석을 통해 토픽을 도출하는 방법을 생각할 수 있다. 하지만 이 경우 각 군집에서 도출한 지역 토픽은 전체 문서로부터 도출한 전역 토픽과 상이하게 나타나므로, 각 문서와 전역 토픽의 대응 관계를 식별할 수 없다. 따라서 본 연구에서는 전체 문서를 하위 군집으로 분할하고, 각 하위 군집에서 대표 문서를 추출하여 축소된 전역 문서 집합을 구성하고, 대표 문서를 매개로 하위 군집에서 도출한 지역 토픽으로부터 전역 토픽의 성분을 도출하는 방안을 제시한다. 또한 뉴스 기사 24,000건에 대한 실험을 통해 제안 방법론의 실무 적용 가능성을 평가하였으며, 이와 함께 제안 방법론에 따른 분할 정복(Divide and Conquer) 방식과 전체 문서에 대한 일괄 수행 방식의 토픽 분석 결과를 비교하였다.

웹기반 어린이 교통 질서 및 안전 교육 시스템의 설계 및 구현 (The Design and Implementation of a Traffic Order and Safety Education System for Kid on Web)

  • 안성옥
    • 공학논문집
    • /
    • 제3권1호
    • /
    • pp.7-20
    • /
    • 1998
  • 우리의 경제성장과 국민소득의 증가와 더불어 자가용승용차가 증가함으로서 자동차 대중화시대에 접어 들었지만 아직까지도 교통안전과 질서에 대한 의식이 성숙하지 못함에 따라 교통안전 사고 등의 문제를 야기시키고 있다. 따라서 웹기반 어린이 교통 질서 및 안전 교육 시스템의 개발은 교통 질서 및 안전 교육의 중요성과 필요성을 홍보하고 교육 함으로서 교통 안전 사고를 예방하는데 목적을 두고 있다. 이 시스템 개발이 이루어진 논문 내용은 다음과 같다. 교통 안전 교육에 필요한 텍스트, 이미지, 동영상 데이터 확보 및 디지타이징과 계층적 관계 확립, 정보간 관계성 분석 및 정보간 하이퍼 링크 구조설계, 시소러스 구축 및 시소러스 기반 정보검색 엔진 설계 및 구현, 교통 질서 및 안전 교육을 위한 데이터베이스 스키마 설계 및 구현과 사용자 중심의 GUI 구축등이다.

  • PDF

TF-IDF를 이용한 침입탐지이벤트 유효성 검증 기법 (A Validation of Effectiveness for Intrusion Detection Events Using TF-IDF)

  • 김효석;김용민
    • 정보보호학회논문지
    • /
    • 제28권6호
    • /
    • pp.1489-1497
    • /
    • 2018
  • 웹 애플리케이션 서비스의 종류가 다양해짐과 동시에 사이버 위협이 급증하여 침입탐지에 대한 연구가 계속되고 있다. 기존의 단일 방어체계에서 다단계 보안으로 진행됨에 따라 대량의 보안이벤트 연관성을 분석하여 명확한 침입에 대해 대응하고 있다. 그러나 대상시스템의 OS, 서비스, 웹 애플리케이션 종류 및 버전을 실시간으로 점검하기 어려운 측면이 있고, 네트워크 기반의 보안장비에서 발생하는 침입탐지 이벤트만으로는 대상지의 취약여부와 공격의 성공여부를 확인 할 수 없는 문제점과 연관성 분석이 되지 않은 위협의 사각지대가 발생할 수 있다. 본 논문에서는 침입탐지이벤트의 유효성을 검증하기 위한 기법을 제안한다. 제안된 기법은 공격에 상응하는 대상시스템의 반응을 사상(mapping)하여 응답트래픽을 추출하고, TF-IDF를 통해 라인(line)기반으로 가중치를 환산하고 높은 수치부터 순차적으로 확인하여 대상시스템의 취약여부와 유효성이 높은 침입탐지이벤트를 검출하였다.

인트라넷 환경에서의 공장자동화를 위한 센서 망 실시간 트래픽 성능 평가 (Performance Analysis of Sensor Network Real-Time Traffic for Factory Automation in Intranet Environment)

  • 송명규;추영열
    • 한국멀티미디어학회논문지
    • /
    • 제11권7호
    • /
    • pp.1007-1015
    • /
    • 2008
  • 제조공정 내의 센서 및 계장기기로 부터의 실시간 데이터를 웹 상에서 제공하기 위해 XML(eXtensible Markup Language)에 기반한 통신 서비스 모델을 제안하였다. HTML(Hyper Text Markup Language)은 웹상에 비실시간 멀티미디어 데이터를 표현하는 데는 적합하나 제조 공장에서 발생되는 실시간 데이터를 표현하는 데는 적합하지 못하다. 인트라넷 환경에서 프로세스 데이터의 XML 기반 웹 서비스 적용을 위해 시스템 설계 기준을 제공을 목적으로 통신 서비스의 실시간 성능에 대해 평가하였다. 데이터 표현을 위한 XML스키마를 제안하고 메시지 길이 증가로 인한 전송 지연과 원 데이터를 정의된 XML 표현으로 변환하는 과정에서 발생하는 처리 지연의 측면에서 시뮬레이션에 의해 성능을 평가하였다. 시뮬레이션에서 XML로의 변환 기능을 수행함에 있어 두 가지 형태의 구현 구조를 가정하였다. 하나는 데이터의 변환이 데이터가 계측기에서 SCC(Supervisory Control Computer)로 전송된 이후 SCC에서 수행되는 구조이고 다른 하나는 데이터가 SCC로 전송되기 전에 계측기에서 변환 과정이 수행되는 구조이다. 두 구조 각각에 대해 20%, 50%, 80%의 부하와 6종의 메시지 길이의 조건 각각을 변화시키면서 성능을 평가하였다. 실험 결과는 Ethernet 100BBaseT 네트워크에서 총 트래픽이 7 Mbps 이하인 시스템에서 적용이 가능함을 보여 주었다.

  • PDF

초고속 라우터 기술산업동향 (Technology and Market Trends on High Speed Router)

  • 김강회;여운동;유재영;홍성화
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2004년도 하계종합학술대회 논문집(1)
    • /
    • pp.233-236
    • /
    • 2004
  • With the internet(World Wide Web) widespread among people after 1995, Information Communication Network, which is basic structure of the internet, is rapidly changing into fiber optics communication. The information conveyed through the internet is being diversified - from simple information based on text to bulky multimedia information such as auido & video data. So the demand for higher speed, hish storage Router is on the crease. This research aims to analyze the general trend of the patent by systematical, multilateral and segmented analysis of the technology's flow and trend, the present technological position of status and the distribution map of the technology by country, technology area using chart and graph.

  • PDF

웹기반 문헌분석 및 생물학적 네트워크 분석시스템 개발 (Web based Text-mining and Biological Network Analysis System)

  • 서동민;조성훈;안광성;유석종;박동일
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2017년도 춘계 종합학술대회 논문집
    • /
    • pp.27-28
    • /
    • 2017
  • 다양한 위상학적 관계(topological relation)를 분석하는 네트워크 분석은 복잡한 데이터에서 숨어있는 특성과 사실을 발견하는 기술로 최근 빅데이터 분야에서 데이터 분석 핵심 기술로 급부상하고 있다. 본 연구에서는 질병연구에 핵심적인 생물학적 네트워크의 생성 및 사용자 친화적인 네트워크 분석시스템을 개발하였다. 개발한 시스템은 PubMed에서 특정 질병과 관련있는 논문 요약 정보를 자동 수집후 텍스트마이닝을 통해 질병 관련 화합물, 유전자 그리고 상호작용 정보를 추출해 생물학적 네트워크를 생성하는 기능을 제공한다. 또한, 연구자가 손쉽게 생성된 네트워크에 대한 검색 및 다차원 분석을 수행할 수 있는 기능을 제공한다. 마지막으로 개발한 시스템의 우수성을 입증하기 위해 크론병(Crohn's Disease)에 대한 적용사례를 소개한다.

  • PDF

자바 쓰레드 풀을 이용한 웹 서버의 구현 및 성능 분석 (Implementation and Performance Analysis of Web Server Using Java ThreadPool)

  • 전상현;이광모;엄상용;정연진;구태완
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2000년도 추계학술발표논문집 (하)
    • /
    • pp.1593-1596
    • /
    • 2000
  • 자바는 설계 때부터 네트워크 상의 운영을 고려하여 설계된 언어이기 때문에 소켓 바인딩과 같은 기능을 제공하고 있고, 또한 TCP/IP 프로토콜과 URL 처리 기능을 제공하고 있는 HTTP(HyperText Transfer Protocol) 프로토콜을 동시에 처리할 수 있기 때문에 WWW 서비스를 연동하는 웹서버를 구축하는데 적합한 언어이다. 현재의 인터넷은 점차적으로 발전하여 수요는 급격히 증가하고 있으나, 많은 사용자로 인해 네트워크의 성능저하와 서버의 처리 능력 한계로 인하여 사용자의 수요를 충족시키지 못하고 있다. 본 논문에서는 인터넷을 이용한 네트워킹 프로그램에 있어 멀티쓰레드를 이용하여 응용프로그램을 작성하기 위한 쓰레드의 개요를 설명하고, 쓰레드를 활용한 풀을 구성하기 위한 제반 사항을 기술한다. 또한, 응용프로그램으로 동적 쓰레드, 서버 복제, 쓰레드 풀 웹 서버를 구현하여 성능을 분석한다.

  • PDF