• 제목/요약/키워드: AI learning data

검색결과 823건 처리시간 0.024초

거대언어모델의 차별문제 비교 연구 (A Comparative Study on Discrimination Issues in Large Language Models)

  • 이위;황경화;최지애;권오병
    • 지능정보연구
    • /
    • 제29권3호
    • /
    • pp.125-144
    • /
    • 2023
  • 최근 ChatGPT 등 거대언어모델(Large Language Models)의 활용은 대화형상거래, 모바일금융 서비스 등 다양한 분야에서 사용이 증가하고 있다. 그러나 주로 기존 문서를 학습하여 만들어진 거대언어모델은 문서에 내재된 인간의 다양한 편향까지도 학습할 수 있다. 그럼에도 불구하고 거대언어모델에 편향과 차별의 양상에 대한 비교연구는 거의 이루어지지 않았다. 이에 본 연구의 목적은 거대언어모델안에 9가지 차별(Age, Disability status, Gender identity, Nationality, Physical appearance, Race ethnicity, Religion, Socio-economic status, Sexual orientation)의 존재유무 또는 그 정도를 점검하고 발전 방안을 제안하는 것이다. 이를 위해 차별 양상을 특정하기 위한 도구인 BBQ (Bias Benchmark for QA)를 활용하여 ChatGPT, GPT-3, Bing Chat 등 세가지 거대언어모델을 대상으로 비교하였다. 평가 결과 거대언어모델에 적지 않은 차별적 답변이 관찰되었으며, 그 양상은 거대언어모델에 따라 차이가 있었다. 특히 성차별, 인종차별, 경제적 불평등 등 전통적인 인공지능 윤리 이슈가 아닌 노인차별, 장애인차별에서 문제점이 노출되어, 인공지능 윤리의 새로운 관점을 찾을 수 있었다. 비교 결과를 기반으로 추후 거대언어모델의 보완 및 발전 방안에 대해 기술하였다.

3DentAI: 파노라마 X-ray로부터 3차원 구강구조 복원을 위한 U-Nets (3DentAI: U-Nets for 3D Oral Structure Reconstruction from Panoramic X-rays)

  • ;문성용;유원상
    • 정보처리학회 논문지
    • /
    • 제13권7호
    • /
    • pp.326-334
    • /
    • 2024
  • 파노라마 X-ray (PX) 및 Cone Beam Computed Tomography (CBCT)와 같은 구강 영상 기술은 영상 촬영 시 환자의 편의성과 전체 치아 정보를 시각화할 수 있는 능력으로 인해 치과 진료소에서 가장 선호되는 영상 기법이다. PX는 일상적인 임상 치료에 선호되고, CBCT는 복잡한 수술 및 임플란트 치료에 선호된다. 그러나 PX는 3차원 공간정보가 부족하다는 한계가 있는 반면 CBCT는 환자에게 높은 방사선 노출을 초래한다. PX가 이미 사용 가능한 경우 PX로부터 3D강 구강구조를 복원함으로써 추가 비용을 줄이고 방사선량을 피할 수 있다. 본 논문에서는 PX 이미지로부터 구강구조의 3차원 복원을 위한 U-Net 기반 딥러닝 프레임워크인 3DentAI를 제안한다. 제안된 프레임워크는 PX 이미지에서 깊이를 추정하기 위한 Attention U-Net 기반 재구성 모듈, 사전 정의된 초점 골 및 광선 데이터를 사용하여 예측된 편평 볼륨을 턱 모양에 정렬하기 위한 재정렬 모듈과, 구강의 원활한 표현을 얻기 위해 누락된 정보를 보간하는 3D U-Net 기반 개선 모듈의 세 가지 모듈로 구성된다. 네트워크를 훈련하기 위해, 쌍을 이루는 PX 및 CBCT 데이터셋 대신에 광선 추적 및 렌더링을 통해 CBCT로 부터 합성한 PX 데이터를 사용하였다. 600명의 환자로 구성된 다양한 데이터셋으로 모델을 훈련한 결과, 낮은 계산 복잡도에도 GAN 기반 모델에 비해 우수한 성능을 보였다.

ICT 기반 환경모니터링 센서 데이터 검증을 위한 원스탑 플랫폼 (One-stop Platform for Verification of ICT-based environmental monitoring sensor data)

  • 채민아;조재혁
    • Journal of Platform Technology
    • /
    • 제9권1호
    • /
    • pp.32-39
    • /
    • 2021
  • 기존 환경측정기기는 전자파 및 친환경 제품 인증, 내구성 시험 위주이며, 센서 신뢰성 검증 및 측정 데이터에 대한 검증은 형식 승인 및 등록, 인수시험, 초기교정, 주기시험 등을 통해 센서 성능평가 위주로 수행된다. 본 플랫폼은 각 타겟 센서별 성능평가 뿐만 아니라 센서의 데이터 신뢰성에 대한 검증체계 지원 ICT 기반 환경 모니터링 센서 신뢰성 검증 체계를 구축하였다. 환경 정보에 대한 센서 데이터를 수집할 센서보드를 제작하였고 센서 및 데이터 신뢰성 평가 및 검증 서비스 체계를 규격화 하였다. 또한, ICT 기반 센서 데이터 신뢰성 평가 및 검증을 위해 LoRa 통신을 이용한 센서 데이터 플랫폼 모니터링 프로토타입을 제작하였고 이를 스마트 시티 등에 실증 테스트하였다. 해당 시스템을 통해 받은 데이터 분석을 위해 머신러닝을 이용하여 최적화 알고리즘 개발하였다. 이를 통해 신뢰성 검증을 위한 센서 빅데이터 분석시스템을 구축하였고 통합 평가 및 검증 시스템의 기반을 마련하였다.

합성곱 신경망 기반 채점 모델 설계 및 적용을 통한 운동학 그래프 답안 자동 채점 (The Automated Scoring of Kinematics Graph Answers through the Design and Application of a Convolutional Neural Network-Based Scoring Model)

  • 한재상;김현주
    • 한국과학교육학회지
    • /
    • 제43권3호
    • /
    • pp.237-251
    • /
    • 2023
  • 본 연구는 합성곱 신경망을 활용한 자동 채점 모델을 설계하고 학생의 운동학 그래프 답안에 적용함으로써, 과학 그래프 답안에 대한 자동 채점의 가능성을 탐색하였다. 연구자가 작성한 2,200개의 답안을 2,000개의 훈련 데이터와 200개의 검증 데이터로 데이터셋을 구성하고, 202개의 학생 답안을 100개의 훈련 데이터와 102개의 시험 데이터로 데이터셋을 구성하여 연구를 진행하였다. 먼저, 자동 채점모델을 설계하고 성능을 검증하는 과정에서는 연구자가 작성한 답안 데이터셋을 활용하여 그래프 이미지 분류에 최적화되도록 자동 채점모델을 완성하였다. 다음으로 자동 채점 모델에 훈련 데이터셋을 여러 유형으로 학습시키면서 학생의 시험 데이터셋에 대한 채점을 수행하여 훈련 데이터의 양이 많고 다양할수록 자동 채점 모델의 성능이 향상된다는 것을 확인하였고, 최종적으로 인간 채점과의 일치율은 97.06%, 카파 계수는 0.957, 가중 카파 계수는 0.968을 얻었다. 한편, 훈련 데이터로 학습되지 않은 유형의 답안의 경우 인간 채점자들 간에는 채점이 거의 일치하였으나, 자동 채점 모델은 일치하지 않게 채점하는 것을 확인하였다.

가상현실 기반의 인공지능 영어회화 시스템 (English Conversation System Using Artificial Intelligent of based on Virtual Reality)

  • 천은영
    • 한국융합학회논문지
    • /
    • 제10권11호
    • /
    • pp.55-61
    • /
    • 2019
  • 외국어 교육을 실현하기 위하여 기존의 다양한 교육 매체들이 제공되고 있지만, 교구 및 매체프로그램에 대한 비용이 많이 들고 실시간 대응력이 떨어지는 단점이 존재한다. 이 논문에서는 VR과 음성인식을 기반으로 한 인공지능 유형의 영어회화 시스템을 제안한다. 시스템 구축을 위해 Google CardBoard VR과 Google Speech API를 이용하며 가상현실 환경 제공 및 대화를 위한 인공지능 알고리즘을 개발하였다. 제안하는 음성인식 서버시스템에서는 사용자가 발화한 문장을 단어 단위로 분리해 데이터베이스에 저장된 데이터 단어들과 비교하여 확률적으로 가장 높은 것을 답으로 제공할 수 있으며 사용자들이 가상현실의 인물과 적절한 대화 및 응답이 가능하다. 대화가 제공되는 기능은 상황별 대화와 주제에 독립적이며, AI 비서와 나눈 대화 내용을 사용자 시스템에서 실시간 확인이 가능하도록 구현하였고 실험을 통하여 음성인식에 대한 응답비율을 확인하였다. 이 논문에서 제안하는 가상현실과 음성인식 기능을 접목한 시스템을 통하여 4차 산업혁명에 관련한 가상교육 콘텐츠 서비스 확장에 이바지할 것을 기대한다.

불법복제물 고속검색 및 Heavy Uploader 프로파일링 분석기술 연구 (High-Speed Search for Pirated Content and Research on Heavy Uploader Profiling Analysis Technology)

  • 황찬웅;김진강;이용수;김형래;이태진
    • 정보보호학회논문지
    • /
    • 제30권6호
    • /
    • pp.1067-1078
    • /
    • 2020
  • 인터넷 기술의 발달함에 따라 많은 콘텐츠가 생산되고 그 수요가 증가하고 있다. 이에 따라 유통되고 있는 콘텐츠 수가 증가하였고, 반면에 저작권을 침해하는 불법복제물을 유포하는 건수도 증가하고 있다. 한국저작권보호원은 문자열 매칭 기반 불법복제물 추적관리시스템을 운영하고 있으며, 이를 우회하기 위해 다수의 노이즈를 삽입하므로 정확한 검색이 어려운 현실이다. 최근, 노이즈를 제거하기 위한 자연어 처리, AI 딥러닝 기술을 이용한 연구와 저작권 보호를 위한 다양한 블록체인 기술이 연구되어 있으나 한계가 있다. 본 논문에서는 온라인에서 수집한 데이터에 노이즈를 제거하고, 키워드 기반 불법복제물을 검색한다. 또한, heavy uploader 대상 프로파일링 분석을 통해 동일 heavy uploader를 추정해 간다. 향후, 불법복제물 검색기술과 heavy uploader 대상 프로파일링 분석 결과를 바탕으로 차단 및 대응기술이 결합하면 저작권 피해를 최소화할 것으로 기대한다.

컴퓨팅 사고기반 융합 수업모델 개발 (Developing a Learning Model based on Computational Thinking)

  • 유정수;장용우
    • 산업융합연구
    • /
    • 제20권2호
    • /
    • pp.29-36
    • /
    • 2022
  • 디지털 사회를 위한 AI와 빅데이터 시대의 컴퓨팅 사고는 컴퓨터가 실행할 수 있는 방식으로 우리가 해결하고자 하는 문제와 솔루션을 표현하는 일련의 문제해결 방법을 의미한다. 컴퓨팅 사고는 컴퓨터 과학의 기본 개념을 도출함으로써 문제를 해결하고 시스템을 설계하고 인간의 행동을 이해하는 것으로, 학생들에게는 어려운 문제와 애매한 퍼즐을 맞추는 접근법이다. 본 논문에서 우리는 컴퓨팅 사고를 댄스 동작과 융합하여 학생들이 문제를 해결할 수 있는 수업 모델을 개발하였다. 개발된 수업 모델을 가지고 ◯◯대학교 1학년 예비교원 93명을 대상으로 1학기 동안 수업한 결과, 수업 참가자들은 비디오 수준의 만족스러운 알고리즘을 만들어 냈다. 또한, 제안된 모델이 수업 참여 학생들의 컴퓨팅 사고 이해에 크게 기여함을 알 수 있었다.

5G 기반 스마트 철도 통신 기술 동향 (5G based Smart Railway Communication Technology Trends)

  • 김영동;김종기;이상학;박은경
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 춘계학술대회
    • /
    • pp.478-480
    • /
    • 2022
  • 차세대 철도 기술로서 스마트 철도는 정보통신기술의 발전과 함께 급격하게 진화할 것으로 예상된다. 특히 5G의 상용화와 더불어 이를 기반으로 한 스마트 철도는 철도 운영뿐 아니라 승객 서비스 등에서 한층 진화된 교통수단으로 발전할 것으로 예상된다. 따라서 스마트 철도를 지원할 이동통신 구조로서 5G 및 이를 기반으로 한 AI, 빅데이터, 딥러닝을 비롯한 서버 기술, 정보보호 기술, 센서 및 IoT 기술 등에서 스마트 철도와 연관된 기술 동향을 조사, 분석하는 하는 것은 매우 중요한 일이라 생각된다. 따라서 본 연구에서는 스마트 철도와 관련된 5G 기반 통신 기술 및 응용기술 들을 분석하고 신기술 동향을 고찰하여 본다. 본 연구의 결과는 스마트 철도 연구 및 구축, 스마트 철도 통신 기술의 연구 및 개발 등에 활용될 수 있을 것으로 예상된다.

  • PDF

PM10 예측 성능 향상을 위한 농도별 예측 모델 설계 (Prediction Model Design by Concentration Type for Improving PM10 Prediction Performance)

  • 조경우;정용진;오창헌
    • 한국항행학회논문지
    • /
    • 제25권6호
    • /
    • pp.576-581
    • /
    • 2021
  • 고농도의 경우 저농도와 비교하였을 때, 발생 빈도수의 차이와 발생 환경에 대한 차이로 예측 성능의 한계를 두드러지게 보이고 있다. 이러한 문제를 해결하기 위해 본 논문에서는 인공신경망 알고리즘을 이용하여 저농도와 고농도로 분류하고 구분된 농도별로 특성을 학습시킨 두 가지 예측 모델을 통해 예측을 수행하는 모델을 제안하였다. 저농도와 고농도를 분류하기 위해 DNN 기반의 분류 모델을 설계하고 분류모델을 통해 구분된 저농도와 고농도를 기준으로 농도별 특성을 반영하기 위한 저농도 예측 모델과 고농도 예측 모델을 설계하였다. 농도별 예측 모델의 성능 평가 결과, 저농도 예측 정확도가 90.38%, 고농도 예측 정확도는 96.37% 의 예측 정확도를 보였다.

이미지 분류를 위한 오토인코더 기반 One-Pixel 적대적 공격 방어기법 (Autoencoder-Based Defense Technique against One-Pixel Adversarial Attacks in Image Classification)

  • 심정현;송현민
    • 정보보호학회논문지
    • /
    • 제33권6호
    • /
    • pp.1087-1098
    • /
    • 2023
  • 인공지능 기술의 급격한 발전으로 다양한 분야에서 적극적으로 활용되고 있으나, 이와 함께 인공지능 기반 시스템에 대한 공격 위협이 증가하고 있다. 특히, 딥러닝에서 사용되는 인공신경망은 입력 데이터를 고의로 변형시켜 모델의 오류를 유발하는 적대적 공격에 취약하다. 본 연구에서는 이미지에서 단 하나의 픽셀 정보만을 변형시킴으로써 시각적으로 인지하기 어려운 One-Pixel 공격으로부터 이미지 분류 모델을 보호하기 위한 방법을 제안한다. 제안된 방어 기법은 오토인코더 모델을 이용하여 분류 모델에 입력 이미지가 전달되기 전에 잠재적 공격 이미지에서 위협 요소를 제거한다. CIFAR-10 데이터셋을 이용한 실험에서 본 논문에서 제안하는 오토인코더 기반의 One-Pixel 공격 방어 기법을 적용한 사전 학습 이미지 분류 모델들은 기존 모델의 수정 없이도 One-Pixel 공격에 대한 강건성이 평균적으로 81.2% 향상되는 결과를 보였다.