• 제목/요약/키워드: 데이터 편향성

검색결과 42건 처리시간 0.024초

집단지성(Collective Intelligence)과 의사결정의 편향성 (Collective Intelligence and Human Decision Bias)

  • 한주희;신경식;채상미
    • Journal of Information Technology Applications and Management
    • /
    • 제22권2호
    • /
    • pp.113-122
    • /
    • 2015
  • Collective intelligence can be an influential factor of decision-making based on collaboration and information exchange between individuals. Our study explores whether collective intelligence can mitigate the loss aversion effect, bias and error in human judgment, and collective intelligence in online communities can reduce the loss aversion effect. Our community settings display both individual-level and group-level loss aversion effect, investigate effective collective intelligence characteristics like investment commitment, participant experience. Using a multi-method approach our research comprises a web-based experiment with 100 participants investing 3 situations from a real-world community, data from a survey measuring loss aversion behavior of participants. The results suggest the loss aversion effect mitigates under the online-circumstance. Overall, our results suggest that, while collective intelligence mitigates the loss aversion effect, participants do not transfer these results to other settings.

주제어 문장거리를 이용한 뉴스 편향성 분석 그래프 학습 (Graph Learning System for Analyzing Bias among News Using Keyword Distance Model)

  • 조찬우;조찬형
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.533-538
    • /
    • 2023
  • 문서에서 저자의 의도와 주제, 그 안에 포함된 감성을 분석하는 것은 자연어 연구의 핵심적인 주제이다. 이와 유사하게 특정 글에 포함된 정치적 문화적 편향을 분석하는 것 역시 매우 의미 있는 연구주제이다. 우리는 최근 발생한 한 사건에 대하여 여러 신문사와 해당 신문사에서 생산한 기사를 중심으로 해당 글의 정치적 편향을 정량화 하는 방법을 제시한다. 그 방법은 선택된 주제어들의 문장 공간에서의 거리를 중심으로 그래프를 생성하고, 생성된 그래프의 기계학습을 통하여 편향과 특징을 분석하였다. 그리고 그 그래프들의 시간적 변화를 추적하여 특정 신문사에서 특정 사건에 대한 입장이 시간적으로 어떻게 변화하였는지를 동적으로 보여주는 그래프 애니메이션 시스템을 개발하였다. 실험을 위하여 최근 이슈에 대하여 12개의 신문사에서 약 2000여 개의 기사를 수집하였다. 그 결과, 약 82%의 정확도로 일반적으로 알려진 정치적 편향을 예측할 수 있었다. 또한, 학습 데이터에 쓰이지 않은 신문기사를 활용하여도 같은 정도의 정확도를 보임을 알 수 있었다. 우리는 이를 통하여 신문기사에서의 정치적 편향은 작성자나 신문사의 특성이 아니라 주제어들의 문장 공간에서의 거리 관계로 특성화할 수 있음을 보였다. 할 수 있다.

  • PDF

개별 차량의 비전 센서 기반 차두 시간 데이터를 활용한 경험적 교통류 모형 추정 방법론 (An Estimation Methodology of Empirical Flow-density Diagram Using Vision Sensor-based Probe Vehicles' Time Headway Data)

  • 김동민;심지섭
    • 한국ITS학회 논문지
    • /
    • 제21권2호
    • /
    • pp.17-32
    • /
    • 2022
  • 본 연구에서는 개별 차량의 차두 시간(time headway) 정보를 활용하여 고속도로 환경에서의 단일 링크에 대한 교통류 모형(flow-density diagram)을 추정하는 방법에 대해 탐구한다. 차두 시간 기반 교통류 모형(empirical flow-density diagram) 연구를 위해 차량용 비전 센서가 탑재된 실험 차량에서 9개월동안 수집된 데이터의 전처리 및 GIS 기반 맵 매칭을 수행한다. 기존의 교통류 모델식을 활용한 차두 시간 기반 교통류 모형(empirical flow-density diagram)의 검증을 위해, 차량 검지기 기반의 VDS(Vehicle Detection System) 데이터(loop detection traffic data) 기반 교통류 모형과 결과 비교 및 분석을 수행한다. 차두 시간 기반 교통류 모형의 추정 오차 원인을 분석하기 위해 각 교통류 모형의 차두 시간 및 차두 거리의 확률분포와 단위시간 교통량과 차량 밀도의 표준편차를 활용하였다. 분석 결과 링크 내 제한된 샘플 차량 대수 및 수집 데이터에 대한 주행환경 편향성이 추정 오차의 주된 요인이며. 이에 따른 추정 오차 개선을 위한 방법에 대해 제안한다.

A Comparative Study on Data Augmentation Using Generative Models for Robust Solar Irradiance Prediction

  • Jinyeong Oh;Jimin Lee;Daesungjin Kim;Bo-Young Kim;Jihoon Moon
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권11호
    • /
    • pp.29-42
    • /
    • 2023
  • 본 논문은 서울, 부산, 인천과 같은 대한민국의 주요 도시들을 대상으로 일사량 예측 정확도를 향상하기 위한 방법론을 제안한다. 제안한 방법론은 먼저 GAN, CTGAN, Copula GAN, WGANGP, TVAE 등 다섯 가지 생성 모델을 이용하여 기존 학습 데이터와 유사한 독립 변수들을 생성한다. 다음으로 모델 학습에서의 데이터 편향성을 개선하고자, 생성한 독립 변수들에서 각각 랜덤 포레스트와 심층 신경망을 통해 종속 변숫값을 도출하여 학습 데이터 셋을 구축하고, 이를 기존 학습데이터 셋과 결합하여 예측 모델을 구성한다. 실험 결과, 증강된 데이터 셋으로 학습한 모델들은 기존 데이터 셋으로 학습한 모델들보다 향상된 성능을 나타내었다. 특히 CTGAN은 복잡한 다변량 데이터 관계를 효과적으로 다루는 메커니즘으로 인해 우수한 결과를 도출하였으며, 생성된 데이터는 일사량의 다양한 변화와 실제 변동성과 효과적으로 반영하였다. 제안한 방법론은 고품질의 생성 데이터로 학습 데이터를 증강함으로써, 데이터 부족 현상 문제를 다룰 수 있을 뿐만 아니라 지속 가능한 발전을 위한 태양광 발전 시스템 운영에도 이바지할 수 있을 것으로 기대한다.

웹 아카이브 OASIS에 관한 고찰 (Research on the OASIS, a Web Archive in Korea)

  • 윤정옥
    • 한국문헌정보학회지
    • /
    • 제44권2호
    • /
    • pp.5-27
    • /
    • 2010
  • 이 연구에서는 국립중앙도서관이 구축 운영하는 웹 아카이브인 OASIS의 특성과 문제점을 살펴보았다. OASIS 웹 사이트를 통해 제공되는 웹 자원 콘텐츠의 현황을 검토하고, 향후 필요한 개선 방안을 제 안하였다. 이 연구를 위해 2009년 5월 20일부터 7월 2일 사이 OASIS 웹 사이트에서 '문학'과 '사회과학'분야의 콘텐츠 및 이용 가능한 서비스를 검토한 결과, 수집된 콘텐츠의 주제 분포의 편중, 저작자/발행자 편향성과 권위의 근거 미약, 정보의 유일성과 최신성 결여, 웹 문서와 웹 사이트의 중복 수집, 학술적가치의 근거 결여 등 문제점이 발견되었다. 주제전문가의 활용과 실명제, 메타데이터 요소 추가 및 기본적 목표의식의 지속적 확인 등이 필요함을 제안하였다.

대규모 언어 모델의 언어 패턴 다양화를 위한 반복적 피드백 기반 성격 페르소나 생성법 (Iterative Feedback-based Personality Persona Generation for Diversifying Linguistic Patterns in Large Language Models)

  • 황태호;송호윤;신지수;조석민;박종철
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.454-460
    • /
    • 2023
  • 대규모 언어 모델(Large Language Models, LLM)의 발전과 더불어 대량의 학습 데이터로부터 기인한 LLM의 편향성에 관심이 집중하고 있다. 최근 선행 연구들에서는 LLM이 이러한 경향성을 탈피하고 다양한 언어 패턴을 생성하게 하기 위하여 LLM에 여러가지 페르소나를 부여하는 방법을 제안하고 있다. 일부에서는 사람의 성격을 설명하는 성격 5 요인 이론(Big 5)을 이용하여 LLM에 다양한 성격 특성을 가진 페르소나를 부여하는 방법을 제안하였고, 페르소나 간의 성격의 차이가 다양한 양상의 언어 사용 패턴을 이끌어낼 수 있음을 보였다. 그러나 제한된 횟수의 입력만으로 목표하는 성격의 페르소나를 생성하려 한 기존 연구들은 세밀히 서로 다른 성격을 가진 페르소나를 생성하는 데에 한계가 있었다. 본 연구에서는 페르소나 부여 과정에서 피드백을 반복하여 제공함으로써 세세한 성격의 차이를 가진 페르소나를 생성하는 방법론을 제안한다. 본 연구의 실험과 분석을 통해, 제안하는 방법론으로 형성된 성격 페르소나가 다양한 언어 패턴을 효과적으로 만들어 낼 수 있음을 확인했다.

  • PDF

인공지능 윤리 강화를 위한 제도적 개선방안 연구 (Research on institutional improvement measures to strengthen artificial intelligence ethics)

  • 차건상
    • 융합보안논문지
    • /
    • 제24권2호
    • /
    • pp.63-70
    • /
    • 2024
  • 인공지능 기술의 발전으로 우리의 삶은 혁신적으로 변화하고 있지만, 동시에 윤리적 문제들도 새롭게 대두되고 있다. 특히 알고리즘 및 데이터 편향성에 의한 차별문제, 딥페이크 및 개인정보 유출 문제 등은 인공지능 서비스확대에 따라 사회적으로 해결해야 할 선결과제라 판단된다. 이를 위해 본 논문에서는 인공지능 윤리 측면에서 인공지능의 개념과 윤리적 이슈를 살펴보고 이를 예방하기 위한 각국의 윤리 가이드라인, 법률, 인공지능 영향평가제도, 인공지능 인증제도와 인공지능 알고리즘 투명성 관련 기술 현황 등을 살펴보고 인공지능 윤리 강화를 위한 제도적 개선방안을 제시하고자 한다.

빅데이터 분석을 활용한 초기 정보 기반 화재현장 위험도 예측 모델 개발 연구 (A Study on the Development of a Fire Site Risk Prediction Model based on Initial Information using Big Data Analysis)

  • 김도형;조병완
    • 한국재난정보학회 논문집
    • /
    • 제17권2호
    • /
    • pp.245-253
    • /
    • 2021
  • 연구목적: 본 연구는 화재발생 건축물 정보, 신고자 취득 정보 등 초기 정보를 활용하여 화재현장의 위험도를 예측하여, 재난 발생 초기에 효과적인 소방자원 동원 및 적절한 대응을 위한 피해최소화 전략 수립을 지원하는 위험도 예측 모델을 개발하고자 한다. 연구방법: 화재 통계 데이터 상에서 화재의 피해규모와 관련된 변수 규명을 위해 머신러닝 알고리즘을 이용한 변수간 상관성 분석을 실시하여 예측 가능성을 검토하고, 데이터 표준화 및 이산화 등의 전처리를 통해 학습 데이터 셋을 구축하였다. 이를 활용하여 예측 정확도가 높은 것으로 평가 받고 있는 복수의 머신러닝 알고리즘을 테스트하여 가장 정확도가 높은 알고리즘을 적용한 위험도 예측 모델을 개발하였다. 연구결과: 머신러닝 알고리즘 성능 테스트 결과 랜덤포레스트 알고리즘의 정확도가 가장 높게 나왔으며, 위험도 등급에 대해서는 중간치에 대한 정확성이 상대적으로 높은 것으로 확인되었다. 결론: 화재 통계 상 피해규모 데이터의 편향성에 의해 예측모델 정확도가 제한적으로 나타났으며, 예측 모델 성능 개선을 위해 데이터 정합성 및 결손치 보완 등을 통한 데이터 정제가 필요하다.

프라이빗 블록체인 활용 FTA원산지 정보관리 시스템 프로토타입 개발 (Development of an FTA origin information management system prototype utilizing private block chain)

  • 조형민;김종현;이경희
    • 한국빅데이터학회지
    • /
    • 제4권1호
    • /
    • pp.1-10
    • /
    • 2019
  • FTA가 확산됨에 따라 향후 급증할 것으로 예상되는 실제조사 등을 대비하여 국내거래 단계에서 원산지 정보의 정확성과 신뢰도 증진 필요성이 높아지고 있다. 그러나 현실적으로 원산지 관련 정보를 수집 및 관리하는데 있어 많은 문제점을 내포하고 있다. 이는 FTA 활용이익의 수출자 편향성과 발급유인 부족 등과 함께 국내 제조기업들의 원산지 정보유통과 관리기술에 관한 부족도 중요한 원인으로 지적되고 있다. 본 논문에서는 프라이빗 블록체인인 Hyperledger Fabric을 사용하여 원산지정보 관리시스템 프로토타입 구축을 통해 국내 기업들의 원활한 FTA원산지 (포괄) 확인서의 관리 및 유통의 효율성을 증진하고, 조작방지를 통한 신뢰성 증진을 지원하는 방안을 제시한다. 블록체인은 분산원장 혹은 신뢰 인터넷으로 불리면서 공급망 상에서 여러 관련기업들이 원산지 정보를 높은 신뢰성을 가지고 즉시 유통할 수 있는 기술적인 인프라를 제공하지만 아직 이의 실제 비즈니스 적용에 관한 연구는 시작단계에 머물러 있다.

  • PDF

과학외교를 위한 데이터기반의 연구주제선정 방법 (Data-Driven Approach to Identify Research Topics for Science and Technology Diplomacy)

  • 여운동;김선호;이방래;노경란
    • 한국콘텐츠학회논문지
    • /
    • 제20권11호
    • /
    • pp.216-227
    • /
    • 2020
  • 두 국가가 본격적으로 외교적 협약을 진행하기 전 우호적인 분위기를 만들기 위해서나, 국가간 정치적 우호 관계를 지속하기 위한 목적 등으로 과학외교를 사용한다. 최근에는 과학기술이 국가 발전에 미치는 영향이 커짐에 따라서 과학외교에 대한 관심이 더욱 집중되고 있다. 과학외교를 수행하기 위해 두 국가가 서로 흥미를 가질 수 있는 협동연구주제를 찾는 것은 전문가 집단에 의해 추천에 의해 이뤄진다. 그러나 이 방법은 전문가의 주관적 판단에 의지하기 때문에 편향성과 이에 따른 문제가 존재한다. 개인적 및 조직적 편향, 유명한 연구자의 후광효과, 전문가마다 다른 추천기준 등이 있을 수 있다. 본 논문에서는 전문가 기반의 방식이 가지는 문제점을 극복하기 위해 한국에서 시도된 빅데이터 기반의 외교를 위한 연구주제 추천방법을 소개한다. 빅데이터를 분석하기 위한 알고리즘은 전통적인 연구분야인 계량서지학 뿐만 아니라 최신 딥러닝 기술을 사용한다. 제안된 방식은 한국과 헝가리 간의 과학외교에 사용되었으며, 데이터기반 주제선정 방식의 가능성을 확인할 수 있었다.