• 제목/요약/키워드: Web contents mining

검색결과 71건 처리시간 0.032초

해양환경 포탈서비스시스템 구축과 운영 (Development and Operation of Marine Environmental Portal Service System)

  • 최현우;권순철
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2003년도 춘계종합학술대회
    • /
    • pp.338-341
    • /
    • 2003
  • MEPS는 해양환경 컨텐츠의 효율적인 운영을 위해 체계적인 시스템 설계를 거천 Oracle RDBMS를 구축하였으며, Web 기반의 사이트 구성은 다양한 컨텐츠의 기획 개발을 통해 뉴스(국내, 국외, 기관 소식, 취업정보), 커뮤니티(포럼, 게시판), 행사일정, POLL, 관련사이트 등과 국내 관련사이트의 웹페이지별 내용을 분류하여 정리한 해양환경정보검색 둥 포탈로써 갖춰야 할 기본 메뉴와 MEPS DB(전문자료, 법규, 국제기구활동), 멀티미디어 DB(온라인세미나, 해양상징이미지), 해양환경퀴즈 DB 등 컨텐츠 개발을 통한 DB체계로 이루어졌다. 또한, 지리적으로 분산된 지역DB로써 해양조사자료를 저장, 관리하는 관련기관들의 정보시스템을 통합연계한 분산DB 해양자료(해양수질, 해양생태)를 통합 검색하여 정점도, 통계치 및 그래프 등으로 출력되는 인터페이스를 개발하여 정보공동 활용을 위한 기반체계를 구현하였다. 사이트 오픈 후 지속적인 컨텐츠 갱신과 국내 검색엔진사이트 등록, 리플렛 제작ㆍ배포, web-mail 서비스 등의 능동적인 홍보활동을 수행함은 물론, 향후 컨텐츠 개발을 위한 기획과 운영체제 유지관리에 활용키 위한 사용자 행동패턴을 모니터링이 수반되어야 할 것이다.

  • PDF

웹 기반 교육에서 학습효과 향상을 위한 학습경로 개인화 시스템에 관한 연구 (A Study on Learning-Path Individualization System for Improving Learning Effects in Web-based Education)

  • 백장현;김영식
    • 정보처리학회논문지A
    • /
    • 제11A권2호
    • /
    • pp.213-222
    • /
    • 2004
  • 최근의 웹 기반 교수-학습은 학습자 스스로 학습 내용, 학습 시간 및 학습 순서를 선택하고 조직하는 방향으로 나아가고 있다. 즉 학습자 개개인의 특성(선수 지식, 학습 양식, 흥미/관심)에 맞는 적응적인 교수-학습 환경을 제공하는 방향으로 변화되고 있다. 본 연구에서는 웹 기반 교수-학습 과정에서 중요시되고 있는 학습자 특성 변인 중에서 학습자의 학습경로를 Apriori 알고리즘을 이용하여 분석하고, 유사한 학습경로를 갖는 학습자들로 그룹화 하였다. 이를 기반으로 학습자 개인에게 학습경로, 인터페이스, 상호작용 등을 제공하기 위한 학습경로 개인화 시스템을 설계하고 개발하였다. 개발된 시스템은 학습자의 학습 패턴에 맞는 최적의 학습 환경을 제공해 줄 수 있을 뿐만 아니라 학습자 개개인의 학습효과를 향상시키는데 효과가 있을 것으로 기대된다.

소셜 컴퓨팅을 위한 연구·학습 주제의 계층적 지식기반 구축 (Building Hierarchical Knowledge Base of Research Interests and Learning Topics for Social Computing Support)

  • 김선호;김강회;여운동
    • 한국콘텐츠학회논문지
    • /
    • 제12권12호
    • /
    • pp.489-498
    • /
    • 2012
  • 본 논문은 연구 학습 주제 지식베이스를 통한 소셜컴퓨팅 지원에 관한 연구로 두 가지 하부 연구로 구성되었다. 첫 번째 연구는 다양한 학문분야에서 전자 도서관 이용자들의 연구 및 학습 주제를 추출하기 위해 분야별로 분류가 잘 되어 있는 NDLTD Union catalog의 석박사 학위 논문 (Electronic Theses and Dissertations : ETDs)을 분석하여 계층적 지식베이스를 구축하는 연구이다. 석박사 학위 논문 이외에 ACM Transactions 저널의 논문과 컴퓨터 분야 국제 학술대회 웹사이트도 추가로 분석하였는데 이는 컴퓨팅 분야의 보다 세분화된 지식베이스를 얻기 위해서이다. 계층적 지식베이스는 개인화 서비스, 추천시스템, 텍스트 마이닝, 기술기회탐색, 정보 가시화 등의 정보서비스와 소셜컴퓨팅에 유용하게 사용될 수 있다. 본 논문의 두 번째 연구 부분에서는 우리가 만든 계층적 지식기반을 활용하여 4개의 사용자 커뮤니티 마이닝 알고리즘 중에서 우리가 수행중인 소셜 컴퓨팅 연구, 즉 구성원간의 결합도에 기반한 추천시스템에 최상의 성능을 보이는 그룹핑 알고리즘을 찾는 성능 평가 연구 결과를 제시하였다. 우리는 이 논문을 통해서 우리가 제안하는 연구 학습 주제 데이터베이스를 사용하는 방법이 기존에 사용자 커뮤니티 마이닝을 위해 사용되던 비용이 많이 필요하고, 느리며, 개인정보 침해의 위험이 있는 인터뷰나 설문에 기반한 방법을 자동화되고, 비용이 적게 들고, 빠르고, 개인정보 침해 위험이 없으며, 반복 수행시에도 일관된 결과를 보여주는 방법으로 대체할 수 있음을 보이고자 한다.

개화기 조선 체류 서양인 기록물의 디지털 아카이브 시스템 구축 (Construction of the Digital Archive System from the Records of Westerners Who Stayed in Korea during the Enlightenment Period of Chosun)

  • 정희선;김희순;송현숙;이명희
    • 한국비블리아학회지
    • /
    • 제27권4호
    • /
    • pp.229-249
    • /
    • 2016
  • 본 연구는 개화기 조선 체류 서양인 기록물의 디지털 아카이브를 구축하여 지역문화콘텐츠로 활용하기 위하여 수행되었다. 서양인 기록물 22권을 대상으로 선정하여 10개의 대주제, 40개의 중주제, 239개의 소주제로 된 분류체계를 구성하고 38개 메타데이터 항목을 추출하였다. 텍스트 내용의 분석과 입력자료 유형을 분류하여 엑셀로 된 데이터베이스를 구축하고, 다양한 접근점에 의한 검색과 정보 제공을 위하여 웹기반의 디지털 아카이브 시스템을 개발하였다. 추후연구를 위하여 서양인 기록물 자료의 지속적인 발굴을 통한 아카이브 내용의 양적 확대방안, 개별 아카이브 시스템을 연계한 디지털 한국학 아카이브의 통합정보시스템 구축, 문화유산분야 분류체계 표준화와 패싯구조를 고려한 다차원적인 분류체계 개발, 메타데이터 포맷의 표준화를 통한 콘텐츠의 일관성 유지, 의미검색 기능과 데이터마이닝 기능을 활용한 온톨로지 구축을 제안하였다.

Python을 이용한 SNS 크롤링 시스템 구축 (Building an SNS Crawling System Using Python)

  • 이종화
    • 한국산업정보학회논문지
    • /
    • 제23권5호
    • /
    • pp.61-76
    • /
    • 2018
  • 현대인이 살고 있는 네트워크 세상으로 모든 사물들이 들어오고 있다. 사물에 센서를 부착하는 사물인터넷의 영향으로 인해 네트워크로 실시간 데이터를 주고받는 것이 가능해졌다. 현대인들의 필수품인 모바일 디바이스는 일상생활의 모든 자취를 실시간으로 남기는 역할을 하고 있다. 바로 소셜 네트워크 서비스를 통하여 정보획득 활동과 커뮤니케이션 활동을 실시간으로 거대한 네트워크에 남기고 있는 것이다. 비즈니스 관점에서 고객의 니즈 분석은 바로 SNS 자료에서부터 시작된다는 등가가 성립된다. 본 연구는 웹 환경의 SNS 콘텐츠를 파이썬을 이용하여 실시간으로 자동 수집시스템을 구축하고자 한다. 세계적으로 많은 이용자수를 확보하고 있는 인스타그램, 트위터, 유튜브의 비정형적 데이터 수집 시스템을 통하여 고객의 니즈 분석에 도움이 되고자 한다. 파이썬의 웹드라이버 환경에서 가상 웹브라우저를 이용하여 마이닝 처리와 NLP 과정을 거쳐 DB에 저장된다. 본 연구의 결과 웹페이지를 통하여 서비스를 진행하고자하며 검색 기능만으로 원하는 데이터가 자동 수집되며 데이터의 시계열 분석을 통하여 네티즌의 이슈 반응을 실시간으로 확인할 수 있었다. 또한 검색부터 실행결과가 나오기까지 5초 이내 이루어지므로 제시된 알고리즘의 우수성을 확인하였다.

사용자의 재생 시간을 이용한 멀티미디어 추천 시스템 (A Multimedia Recommender System Using User Playback Time)

  • 권형준;정동근;홍광석
    • 인터넷정보학회논문지
    • /
    • 제10권1호
    • /
    • pp.111-121
    • /
    • 2009
  • 본 논문에서는 사용자의 재생 시간을 이용한 멀티미디어 추천 시스템을 제안한다. 제안하는 시스템은 사용자에 의해 요청된 멀티미디어 콘텐츠와 그것이 재생된 시간을 기록하고, 기록된 데이터를 가지고 퍼지 연관규칙 탐사 방법을 이용하여 사용자가 관심을 보일 만한 멀티미디어 콘텐츠와 사용자에 의해 재생된 시간에 기반하여 선호 등급을 예측한다. 제안하는 방법은 사용자의 선호 정보를 별도로 입력 받지 않고도 예측된 선호 등급에 따라서 추천 목록에 대한 선호정도를 예측할 수 있으며, 거짓된 선호 정보의 유입을 방지하는 장점이 있다. 유효성 검증을 위해 제안하는 시스템을 구현하고 실험한 결과, 사용자로부터 입력 받은 선호 정보를 포함하지 않은 트랜잭션으로부터 사용자가 높은 선호도를 보일 것이라 예상되는 추천 목록을 선별하여 추천 시스템에 적용할 수 있음을 확인하였다.

  • PDF

Analysis of Social Media Utilization based on Big Data-Focusing on the Chinese Government Weibo

  • Li, Xiang;Guo, Xiaoqin;Kim, Soo Kyun;Lee, Hyukku
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제16권8호
    • /
    • pp.2571-2586
    • /
    • 2022
  • The rapid popularity of government social media has generated huge amounts of text data, and the analysis of these data has gradually become the focus of digital government research. This study uses Python language to analyze the big data of the Chinese provincial government Weibo. First, this study uses a web crawler approach to collect and statistically describe over 360,000 data from 31 provincial government microblogs in China, covering the period from January 2018 to April 2022. Second, a word separation engine is constructed and these text data are analyzed using word cloud word frequencies as well as semantic relationships. Finally, the text data were analyzed for sentiment using natural language processing methods, and the text topics were studied using LDA algorithm. The results of this study show that, first, the number and scale of posts on the Chinese government Weibo have grown rapidly. Second, government Weibo has certain social attributes, and the epidemics, people's livelihood, and services have become the focus of government Weibo. Third, the contents of government Weibo account for more than 30% of negative sentiments. The classified topics show that the epidemics and epidemic prevention and control overshadowed the other topics, which inhibits the diversification of government Weibo.

소셜미디어 뉴스를 이용한 관심 이슈 연구 (A Study on Interest Issues Using Social Media New)

  • 곽노영;이문봉
    • 한국정보시스템학회지:정보시스템연구
    • /
    • 제32권2호
    • /
    • pp.177-190
    • /
    • 2023
  • Purpose Recently, as a new business marketing tool, short form content focused on fun and interest has been shared as hashtags. By extracting positive and negative keywords from media audiences through comment analysis of social media news, various stakeholders aim to quickly and easily grasp users' opinions on major news. Design/methodology/approach YouTube videos were searched using the YouTube Data API and the results were collected. Video comments were crawled and implemented as HTML elements, and the collection results were checked on the web page. The collected data consisted of video thumbnails, titles, contents, and comments. Comments were word tokenized with the R program, comparing positive and negative dictionaries, and then quantifying polarity. In addition, social network analysis was conducted using divided positive and negative comments, and the results of centrality analysis and visualization were confirmed. Findings Social media users' opinions on issue news were confirmed by analyzing and visualizing the centrality of keywords through social network analysis by dividing comments into positive and negative. As a result of the analysis, it was found that negative objective reviews had the highest effect on information usefulness. In this way, previous studies have been reaffirmed that online negative information has a strong effect on personal decision-making. Corporate marketers will analyze user comments on social network services (SNS) to detect negative opinions about products or corporate images, which will serve as an opportunity to satisfy customers' needs.

테크놀로지 인텔리전스 서비스의 시각화 요소 평가 -사용자 평가를 통한 효용성 분석- (Usefulness Evaluation on Elements for Visualization of Technology Intelligence Service)

  • 이진희;김태홍;이미경;김진형;정한민;성원경;김도완
    • 한국콘텐츠학회논문지
    • /
    • 제11권12호
    • /
    • pp.533-542
    • /
    • 2011
  • 정보 시각화 요소는 사용자에게 정보를 효율적으로 서비스하기 위한 기술로서, 웹의 진화 과정상에서 그 중요성을 높여가고 있다. 본 연구의 분석 대상인 InSciTe는 대용량의 논문과 특허 데이터를 시맨틱 웹 기술과 텍스트 마이닝 기술을 이용하여 R&D 전략 수립을 지원하는 테크놀로지 인텔리전스 서비스이다. 본 연구에서는 대용량의 논문과 특허 데이터를 대상으로 시맨틱 웹 기술과 텍스트 마이닝 기술을 이용하여 R&D 전략 수립을 지원하는 테크놀로지 인텔리전스 서비스인 InSciTe의 시각화 요소들에 대한 효용성 평가를 수행하고, 각각의 서비스 유형마다 정량적 및 정성적 분석을 통하여 사용자들이 선호하는 디자인과 적용 방법을 제안한다. 효용성 평가 결과, InSciTe 내의 시각화 요소들은 사용자의 인지력을 향상시키기 위하여 사용자 친화적으로 구현되었다는 결론을 얻었다.

질의응답 커뮤니티에서 문서 간 이독성 비교 (Comparison of Readability between Documents in the Community Question-Answering)

  • 문길성
    • 한국콘텐츠학회논문지
    • /
    • 제20권10호
    • /
    • pp.25-34
    • /
    • 2020
  • 커뮤니티 질의응답 서비스는 다양한 목적으로 활용되고 있다. 질의응답 문서에서 정보의 품질은 질문의 명확성과 답변 내용의 적절성으로 결정되며 문서의 읽기 쉬운 정도를 나타내는 이독성(readability)은 문서가 가지고 있는 정보의 품질을 평가하기 위한 주요 요소이다. 본 연구의 목적은 국내의 CQA 사이트에서 제공되는 문서의 품질을 측정하는 것이다. 이를 위하여 네이버 지식iN의 '국민 신문고' 커뮤니티의 문서에서 사용된 어휘 수준별 사용 빈도를 비교하고, 작성 기관별 문서의 이독성 지수를 측정하였다. 이독성 지수의 측정은 어휘 수준과 문장 길이를 바탕으로 계산되는 Dale-Chall 공식을 사용하였다. 분석 결과, 답변에서 사용된 어휘는 질문에서 사용된 어휘보다 더 어려운 수준이고 문장 길이도 더 길어서 이독성이 더 낮은 것으로 나타났다. 또한, 질의응답간 이독성의 차이는 작성 기관별로도 차이가 있음을 파악할 수 있었다. 본 연구의 결과는 상담업무에 반영할 수 있는 유용한 정보를 도출하여 온라인상의 민원상담 개선에 활용할 수 있으며, 이독성 지수에 기반하여 문서 수준의 정량적 분석을 시도함으로써 텍스트 마이닝의 주제를 확장할 수 있을 것으로 기대한다.