• 제목/요약/키워드: Blog Posts

검색결과 43건 처리시간 0.026초

블로그 포스팅을 이용한 방송 콘텐츠 영상의 타임라인 단위 태그 클라우드 생성 (Timeline Tag Cloud Generation for Broadcasting Contents using Blog Postings)

  • 손정우;김화숙;김선중;조기성
    • 정보과학회 논문지
    • /
    • 제42권5호
    • /
    • pp.637-641
    • /
    • 2015
  • 최근 SNS, 블로그 등 사용자 참여형 인터넷 매체가 늘어나면서, 방송 콘텐츠에 대한 사용자의 재생산이 활발히 일어나고 있다. 특히, 드라마와 같은 장르에서는 배우가 착용한 옷, 시계 등에서부터, 자동차, 촬영 장소 등 다양한 종류의 정보들이 블로그를 통해 다른 사용자에게 전달되고 있다. 이러한 정보들은 방송 콘텐츠에 대한 직접적인 부가 정보가 되기 때문에, 이를 활용할 경우 양질의 서비스를 제공할 수 있다. 본 논문에서는 이를 위해, 블로그 포스팅을 이용하여 방송 콘텐츠의 특정 타임라인에 태그 클라우드를 생성하는 기술을 제안한다. 제안한 방법에서는 방송 콘텐츠에 대한 블로그 포스팅을 수집하고, 수집된 포스팅으로부터 이미지 주변 단어를 활용하여 태그 셋을 구축한다. 구축된 태그 클라우드는 방송 콘텐츠 프레임과의 이미지 매칭을 통해 특정 타임라인에 태깅된다. 실험에서는 이미지 매칭의 성능과 생성된 태깅된 태그 클라우드를 보임으로써 제안한 방법의 성능을 입증한다.

범주별 고유 정보를 고려한 블로그 포스트의 자동 분류 (Automatic Classification of Blog Posts Considering Category-specific Information)

  • 김수아;오성탁;이지형
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2015년도 제51차 동계학술대회논문집 23권1호
    • /
    • pp.11-14
    • /
    • 2015
  • 많은 블로그 제공 사이트는 블로그 포스트 작성자에게 미리 정의된 범주 (category)에 따라 포스트의 주제에 대하여 범주를 선택할 수 있는 환경을 제공한다. 그러나 블로거들은 작성한 포스트의 범주를 매번 수동으로 선택해야 하는 불편함이 있다. 이러한 불편함의 해결을 위해 블로그 포스트를 자동으로 분류해주는 기능을 제공한다면 블로그의 활용성이 증가할 것이다. 기존의 블로그 문서 분류의 연구는 각 범주의 고유 정보를 반영하는 것에 한계가 있었다. 이러한 문제를 해결하기 위해, 본 논문에서는 범주별 고유 정보를 반영한 어휘 가중치를 제안한다. 어휘 가중치의 분석을 위하여 범주별로 블로그 문서를 수집하고, 수집한 문서에서 어휘의 빈도와 문서의 빈도, 범주별 어휘빈도 등을 고려하여 새로운 지표인 CTF, CDF, IECDF를 개발하였다. 이러한 지표를 기반으로 기존의 Naive Bayes 알고리즘으로 학습하여, 블로그 포스트를 자동으로 분류하였다. 실험에서는 본 논문에서 제안한 가중치 방법인 TF-CTF-CDF-IECDF를 사용한 분류가 가장 높은 성능을 보였다.

  • PDF

What Practical Knowledge Do Teachers Share on Blogs? An Analysis Using Text-mining

  • LEE, Dongkuk;KWON, Hyuksoo
    • Educational Technology International
    • /
    • 제23권1호
    • /
    • pp.97-127
    • /
    • 2022
  • With the recent advancement of technology, there has been an increase in professional development activities, including teachers using blogs to share practical knowledge and reflect on teaching and learning. This study was conducted to identify the contents of practical knowledge shared through the K-12 teachers' blogs. To achieve the research objective, 70,571 blog posts were collected from 329 blogs of K-12 teachers in Korean and analyzed using text mining techniques. The results of the study are as follows. First, practical knowledge sharing activities using teacher blogs have increased. Teachers posted a lot of blogs during the semester. Second, primary school teachers share various curriculum activities, reflections on project classes, class management, opinions related to education, and personal. Third, secondary school teachers share summaries and reviews of curriculum, materials related to college entrance exams, various instructional materials, opinions related to education, and personal experiences on their blogs. This study suggested that blogs are widely used as a venue for sharing practical knowledge of teachers, and that blogs can be a useful way to develop professionalism.

1인 미디어 블로그(Blog)가 포착한 선유도공원 경관 (The Landscape of Seonyoo-do Park Captured in One-Person Media Focusing on Blogs)

  • 박선희;김연금
    • 한국조경학회지
    • /
    • 제39권3호
    • /
    • pp.64-73
    • /
    • 2011
  • 본 연구는 영화, 소설, 풍경화와 같은 재현 매체를 이용한 경관 연구의 연장선상에서 1인 미디어인 블로그(blog)에서의 선유도 경관의 소통 방식과 내용을 검토하였다. 여기에는 정보화 사회의 영향으로 일반인들도 경관 해석과 이에 따른 결과물 생성에 적극적으로 참여하고 있다는 전제가 있었고, 조경 분야에서는 이러한 현상의 가능성과 한계점에 대해 논할 필요가 있다고 보았기 때문이다. 구체적으로 다루는 바는 첫 번째는 블로그에서 많은 호응을 얻고 있는 선유도공원의 경관은 구체적으로 무엇인가에 대한 것이다. 두 번째는 블로그에서의 경관 포착 방식과 해석의 특성이다. 여기에는 전분가 집단 내 담론과의 관계도 포함된다. 세 번째는 블로그에서 포착하고 해석한 경관을 통해 발견할 수 있는 가능성과 한계점은 무엇인가에 대한 것이다. 인터넷에서 검색된 '선유도공원' 관련 블로그 1,000건을 포스팅의 목적에 따라 세 가지로 유형화했다. 첫 번째는 '사진, 출사, 사진 찍기 좋은 곳, 풍경'이라는 키워드로 검색되는 블로그의 포스트들이다. 이들은 선유도공원 정관의 시각적 측면에 집중하고 있다. 두 번째는 '국내 여행, 서울 여행, 여행, 추천'이라는 키워드로 검색되는 것들로서, 여가시간을 보낼 수 있는 공간으로서 선유도 공원에 대한 소개를 주고 담고 있다. 즉, 공간으로서의 효용가치를 다룬다. 그리고 마지막은 선유도공원에서의 개인적인 경험을 기록한 포스트들로서 사진의 피사체는 자신이나 동반한 이들이 된다. 검색 결과, 세 번째 유형이 가장 많았다. 이 세 가지 유형을 토대로 블로그들이 경관을 다루는 방식을 살펴볼 때, 먼저 사람들은 경관을 기록하는 차원을 넘어 연출하는 등 경관 포착 능력을 향상시키고 있고, 주체적이고 능동적으로 경관을 해석하고 있다는 것을 볼 수 있었다. 이러한 일련의 과정은 경관과 장소의 재생산이라 할 수 있다. 또한 이들의 감상과 느낌의 기록은 전문가들이 평가하고 추측했던 바를 보다 구체적이고 체험적으로 제시하고 있었다. 더 나아가서 전문가 담론에서 언급되지 않았던 것들과 공원의 유지관리 및 운영에 대한 언급도 있어 전문가 실천에 대한 모니터링 자료로 활용 가능함을 보여준다. 그러나 부정적 측면도 있었다. 블로거들은 경관을 극화시키거나 비슷한 장면을 반복하는 경우가 많은데, 이는 일종의 이미지화장술이라 할 수 있다. 본 연구의 한계는 먼저 연구 대상인 블로그 자체가 주관적이고 개인적이라 해석에 어려움이 있었다는 것이다. 더불어 하나의 포스트에 다양한 사진이 포함되고 날의 범위도 넓어 내용의 유형화와 계량화에 한계가 있었다. 그러나 블로그 같은 1인 미디어를 통해 경관과 현대인의 관계를 보다 잘 이해할 수 있기에, 조경분야는 이를 어떻게 바라보고 활용해야 할 지에 대해 지속적으로 관심을 가져야 할 것이다.

트렌드 지수를 반영한 블로그 랭킹 알고리즘 (The Blog Ranking Algorithm Reflecting Trend Index)

  • 이용석;김형중
    • 디지털콘텐츠학회 논문지
    • /
    • 제18권3호
    • /
    • pp.551-558
    • /
    • 2017
  • 블로그의 성장은 다양한 정보제공이라는 긍정적 측면과 마케팅적 활용이라는 부정적 수단으로 사용되고 있는 문제를 가지고 있다. 본 연구는 대형 포털의 블로그 포스트의 랭킹 결과를 OpenAPI를 이용하여 수집하였고, 탐색적 데이터 분석기법을 통해서 상위 랭크된 블로그의 특징들을 조사하였다. 분석 결과를 보면 상위 랭크에 영향을 주는 요소로는 블로거의 영향력과 포스트의 최근 생성일에 관련성이 높은 것을 알 수 있었다. 이런 평가 알고리즘의 약점으로 인해 파워 블로거의 포스트 중심으로 검색 결과를 편중되게 보여주는 문제가 있었다. 본 연구에서는 다양한 대중의 관심사를 나타내는 트렌드 지수를 통해 랭킹 점수 적용의 공정성을 확보하고, 전문가에 의해 검증된 신뢰 DB정보를 추가하여 컨텐츠 신뢰성을 높이는 알고리즘을 제안하였다. 개선된 알고리즘을 맛집 검색 결과가 실제 지역 학생들의 추천 맛집정보와의 유사도가 높은 것을 확인하였다. 개선된 알고리즘으로 좀 더 신뢰할 수 있는 정보제공이 가능해 졌으며, 방문자수 증가시키는 불법 앱에 의한 순위 조작이 어려워지는 부가적 개선 효과가 기대된다.

블로그 게시물에 나타난 수도권 보전지역 및 자연자원의 분포 및 특성 (The Distribution and Characteristics of Protected Areas and Natural Resources in the Metropolitan Area in Blog Posts)

  • 이성희;손용훈
    • 한국조경학회지
    • /
    • 제50권5호
    • /
    • pp.30-39
    • /
    • 2022
  • 본 연구에서는 특정 장소 및 대상에 대하여 이용자들이 자유롭게 서술한 블로그 데이터의 누적 콘텐츠 발행량을 활용하여 보전지역 및 자연자원에 대한 사람들의 인지성을 평가하고 특성을 분석하는 것을 목적으로 하였다. 이에 수도권에 위치하고 있는 전체 보전지역 및 자원 중 평가 가능한 곳들을 구별하고, 각 장소에 대하여 사람들이 작성한 블로그 게시물 수를 토대로 종합하여 10단계 구분하여 평가하였다. 연구 결과, 산림에 대한 이용자들의 인지성이 가장 높은 것으로 나타났으며, 도시권에 있어서 보전지역 및 자연자원에 대한 인지성이 더 높게 나타났다. 이는 수도권 주변에 위치하는 보전지역과 자연자원이 이용자들에게 보전의 대상이면서도 자연 관광지로서의 역할을 수행하고 있는 것을 보여준다. 또한 이러한 결과는 국내외 연구에서 도시지역에 있어서 생태계 서비스가 중요하다는 연구결과들과 같은 맥락을 보인다. 본 연구는 기존의 연구방법과는 달리 소셜미디어 분석으로 이용자의 인지 정도를 파악하고, 이를 보전지역 및 자연자원 평가에 적용하였다는 점에서 의의가 있으며, 본 연구의 결과는 향후 도시녹지공간에 대한 대중의 관심 및 인지 정도를 고려하여 관리방안을 마련하거나, 인지성을 높이기 위하여 발전방안을 수립하는 데 기초 자료로 활용될 수 있다. 또한 연구에서 활용된 블로그 누적 콘텐츠 발행량은 공간에 대한 이용자의 관심을 파악하고 모니터링 할 수 있는 점에서 의의가 있다. 단, 본 연구에서는 소셜미디어 콘텐츠 발행량을 기반으로 평가하였기에 각 블로그에 담긴 내용을 세밀하게 살펴보지는 못했다. 또한 보전지역과 자연자원의 경우 개발 이슈와 함께 이용자의 순수한 관점이 아닌 내용이 혼재되어 있을 수 있기 때문에, 추후 평가 대상지에 대한 키워드 분석과 내용분석을 추가하여 평가 내용을 검토하고 보충할 필요가 있다.

블로그 포스트의 자동 분류 시스템 (Automatic Classification of Blog Posts)

  • 조희선;김수아;이현아
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2013년도 제25회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.160-162
    • /
    • 2013
  • 편리한 블로그 사용과 블로그에서의 정보 탐색을 위해서는 내용에 기반한 분류가 필요하다. 대부분의 블로그 사이트에서는 내용 기반 분류를 제공하고 있으나, 블로거들은 자신이 작성한 블로그에 대한 수동 분류를 입력하지 않는 경우가 많다. 본 논문에서는 분류가 제공되는 블로그 사이트에서 각 분류별 문서를 수집하고, 어휘빈도와 문서빈도, 분류별 빈도를 활용하여 문서 내 어휘의 자질 가중치를 부여하고, 다양한 학습기를 이용하여 분류 모델을 생성한 뒤 블로그의 특성에 적합한 자질 추출 알고리즘과 분류 알고리즘을 찾아낸다. 실험에서는 본 논문에서 고안한 CTF-IECDF와 나이브 베이즈 멀티노미얼로 조합한 분류 모델이 75.40%의 분류 정확률을 보였다.

  • PDF

블로그 포스트 자동 품질 평가를 위한 기계학습 기법 비교 연구 (A Comparison of Machine Learning Techniques for Evaluating the Quality of Blog Posts)

  • 한범준;김민정;이형규
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 춘계학술발표대회
    • /
    • pp.385-388
    • /
    • 2010
  • 블로그는 다양한 주제 분야에 대한 내용을 자유롭게 표현할 수 있는 일종의 개인 웹사이트로, 많은 양과 다양성으로 매우 중요한 정보원이 될 수 있다. 블로그는 생산속도가 매우 빠르므로 보다 고품질의 블로그를 선별하는 것이 중요하다. 본 논문에서는 블로그의 본문을 담고 있는 포스트를 대상으로 기계학습 기법을 이용하여 문서의 품질을 자동으로 평가하고자 하였다. 학습을 위한 자질로는 모든 블로그에 공통적으로 적용할 수 있도록 형태소 분석에서 추출한 동사, 부사, 형용사의 내용어만을 선택하였다. 성능 비교를 위해 수작업으로 약 4,600개의 정답 집합을 구축하고, 적합한 기계학습 기법을 찾기 위해 다양한 학습 기법을 사용하여 비교 실험하였다. 실험 결과 Bagging 기법의 성능이 79% F-measure로 가장 좋음을 보여주었다. 한정된 자질을 사용했을 때와 정답 집합의 문서 수 비율이 불균등할 경우 단순함, 유연성, 효율성의 특징을 지닌 Bagging 기법이 적합할 것으로 보인다.

소셜미디어 데이터 분석을 활용한 COVID-19 전후 박쥐의 인식변화 연구 (A Study on the Perception Change of Bats after COVID-19 by Social Media Data Analysis)

  • 이주경;김벼리;김선숙
    • 환경영향평가
    • /
    • 제31권5호
    • /
    • pp.310-320
    • /
    • 2022
  • 본 연구는 국내 최대 소셜 네트워크인 블로그 글을 대상으로 텍스트마이닝 및 네트워크 분석을 통해 COVID-19 발생 후 '박쥐'에 대한 대중들의 인식 변화를 파악하였다. 국내에서 COVID-19 발생전 2019년부터 2020년까지 9,241건의 네이버 블로그 글을 수집하였다. 수집된 자료는 파이썬(Python)과 NetMiner 4.3.2으로 분석하였고, 시기별로 도출된 키워드와 키워드 간 연관성을 통해 박쥐에 대한 대중들의 인식을 심층적으로 분석하였다. 분석결과, 2020년 박쥐 키워드의 출현 빈도는 2019년에 비해 25배 이상 증가하였고, 중심성 수치 또한 3배 이상 증가되었다. 네트워크 분석 결과, '박쥐'에 대한 인식은 COVID-19 발생전과 후 차이를 나타냈다. COVID-19 이전에 박쥐는 야생동물의 한 종(Species)으로 인식되는 경향성이높았던 반면, COVID-19 발생 초기인 2020년 상반기에는 전염병 및 건강 분야와 연관시켜 인간사회를 위협할 수 있는 존재로 강하게 인식하였고, 하반기에는 생태 및 문화 유형 비중이 높아지면서 박쥐에 대한 관심영역이 확장된 것을 확인하였다. 본 연구는 COVID-19 발생 이후 질병 숙주로서 박쥐의 잠재적인 영향에 대한 대중들의 관심과 인식 변화에 대한 정보를 제공함으로써 질병연구의 확장과 공중보건 관리, 미래감염병 대응을 위한 방향을 제시하였다.

소셜미디어 빅데이터의 개체명 인식을 활용한 옥외 힐링 장소 인식 분석 (Outdoor Healing Places Perception Analysis Using Named Entity Recognition of Social Media Big Data)

  • 성정한;이경진
    • 한국조경학회지
    • /
    • 제50권5호
    • /
    • pp.90-102
    • /
    • 2022
  • 최근 힐링에 대한 관심이 증가함에 따라 힐링을 콘셉트로 하는 옥외 공간이 조성되고 있다. 보다 전문적이고 심층적인 옥외 힐링 장소 계획·설계·디자인을 위해 88,155건의 블로그 게시글 텍스트 데이터를 개체명 인식하여 텍스트 마이닝을 진행했다. 옥외 힐링 장소의 인식과 특징을 파악을 위해 출현 빈도 분석과 응집 분석을 진행하였다. 선행연구 고찰을 통해 힐링 장소의 6가지 요소를 도출하였으며, 시간과 인원을 추가한 총 8가지 요소를 통해 인식과 특성을 살펴보았다. 분석 결과 사람들은 힐링 장소를 방문하는 데 있어 장소적요소, 시간적요소, 사회적요소, 활동요소를 인원, 식물, 색상·형태, 심리적 요소보다 중요하게 생각하였다. 상위 출현 키워드를 통해 여러 가지 인식과 특성을 파악할 수 있었다. 응집 분석 결과를 통해 장소적요소, 시간적요소, 사회적요소의 키워드들이 응집되어 나타나 주로 어떤 장소, 어떤 시간대, 누구와 함께 방문하는지 구체적으로 살펴볼 수 있었다. 연구를 통해 실제 사람들이 작성한 인식 데이터를 대량 분석하여 힐링 장소의 인식과 특성을 도출하였으며, 계획과 마케팅적으로 활용할 수 있는 구체적인 요소가 나타남을 확인했다.