• Title/Summary/Keyword: using pattern

Search Result 15,869, Processing Time 0.054 seconds

러프집합분석을 이용한 매매시점 결정 (Rough Set Analysis for Stock Market Timing)

  • 허진영;김경재;한인구
    • 지능정보연구
    • /
    • 제16권3호
    • /
    • pp.77-97
    • /
    • 2010
  • 매매시점결정은 금융시장에서 초과수익을 얻기 위해 사용되는 투자전략이다. 일반적으로, 매매시점 결정은 거래를 통한 초과수익을 얻기 위해 언제 매매할 것인지를 결정하는 것을 의미한다. 몇몇 연구자들은 러프집합분석이 매매시점결정에 적합한 도구라고 주장하였는데, 그 이유는 이 분석방법이 통제함수를 이용하여 시장의 패턴이 불확실할 때에는 거래를 위한 신호를 생성하지 않는다는 점 때문이었다. 러프집합은 분석을 위해 범주형 데이터만을 이용하므로, 분석에 사용되는 데이터는 연속형의 수치값을 이산화하여야 한다. 이산화란 연속형 수치값의 범주화 구간을 결정하기 위한 적절한 "경계값"을 찾는 것이다. 각각의 구간 내에서의 모든 값은 같은 값으로 변환된다. 일반적으로, 러프집합 분석에서의 데이터 이산화 방법은 등분위 이산화, 전문가 지식에 의한 이산화, 최소 엔트로피 기준 이산화, Na$\ddot{i}$ve and Boolean reasoning 이산화 등의 네 가지로 구분된다. 등분위 이산화는 구간의 수를 고정하고 각 변수의 히스토그램을 확인한 후, 각각의 구간에 같은 숫자의 표본이 배정되도록 경계값을 결정한다. 전문가 지식에 의한 이산화는 전문가와의 인터뷰 또는 선행연구 조사를 통해 얻어진 해당 분야 전문가의 지식에 따라 경계값을 정한다. 최소 엔트로피 기준 이산화는 각 범주의 엔트로피 측정값이 최적화 되도록 각 변수의 값을 재귀분할 하는 방식으로 알고리즘을 진행한다. Na$\ddot{i}$ve and Boolean reasoning 이산화는 Na$\ddot{i}$ve scaling 후에 그로 인해 분할된 범주값을 Boolean reasoning 방법으로 종속변수 값에 대해 최적화된 이산화 경계값을 구하는 방법이다. 비록 러프집합분석이 매매시점결정에 유망할 것으로 판단되지만, 러프집합분석을 이용한 거래를 통한 성과에 미치는 여러 이산화 방법의 효과에 대한 연구는 거의 이루어지지 않았다. 본 연구에서는 러프집합분석을 이용한 주식시장 매매시점결정 모형을 구성함에 있어서 다양한 이산화 방법론을 비교할 것이다. 연구에 사용된 데이터는 1996년 5월부터 1998년 10월까지의 KOSPI 200데이터이다. KOSPI 200은 한국 주식시장에서 최초의 파생상품인 KOSPI 200 선물의 기저 지수이다. KOSPI 200은 제조업, 건설업, 통신업, 전기와 가스업, 유통과 서비스업, 금융업 등에서 유동성과 해당 산업 내의 위상 등을 기준으로 선택된 200개 주식으로 구성된 시장가치 가중지수이다. 표본의 총 개수는 660거래일이다. 또한, 본 연구에서는 유명한 기술적 지표를 독립변수로 사용한다. 실험 결과, 학습용 표본에서는 Na$\ddot{i}$ve and Boolean reasoning 이산화 방법이 가장 수익성이 높았으나, 검증용 표본에서는 전문가 지식에 의한 이산화가 가장 수익성이 높은 방법이었다. 또한, 전문가 지식에 의한 이산화가 학습용과 검증용 데이터 모두에서 안정적인 성과를 나타내었다. 본 연구에서는 러프집합분석과 의사결정 나무분석의 비교도 수행하였으며, 의사결정나무분석은 C4.5를 이용하였다. 실험결과, 전문가 지식에 의한 이산화를 이용한 러프집합분석이 C4.5보다 수익성이 높은 매매규칙을 생성하는 것으로 나타났다.

인공지능 기술에 관한 가트너 하이프사이클의 네트워크 집단구조 특성 및 확산패턴에 관한 연구 (Structural features and Diffusion Patterns of Gartner Hype Cycle for Artificial Intelligence using Social Network analysis)

  • 신선아;강주영
    • 지능정보연구
    • /
    • 제28권1호
    • /
    • pp.107-129
    • /
    • 2022
  • 기술경쟁이 심화되고 있는 오늘날 신기술에 대한 선도적 위치의 선점이 중요하다. 선도적 위치의 선점과 적정시점에 기술 획득·관리를 위해 이해관계자들은 지속적으로 기술에 대한 탐색활동을 수행한다. 이를 위한 참고 자료로서 가트너 하이프 사이클(Gartner Hype Cycle)은 중요한 의미가 있다. 하이프 사이클은 기술수명주기(S-curve)와 하이프 수준(Hype Level)을 결합하여 새로운 기술에 대한 대중의 기대감을 시간의 흐름에 따라 나타낸 그래프이다. 새로운 기술에 대한 기대는 기술사업화뿐만 아니라 연구개발 투자의 정당성, 투자유치를 위한 기회의 발판이 된다는 점에서 연구개발 담당자 및 기술투자자의 관심이 높다. 그러나 산업계의 높은 관심에 비해 실증분석을 시도한 선행연구는 다양하지 못하다. 선행문헌 분석결과 데이터 종류(뉴스, 논문, 주가지수, 검색 트래픽 등)나 분석방법은 한정적이었다. 이에 본 연구에서는 확산의 주요한 채널이 되어가고 있는 소셜네트워크서비스의 데이터를 활용하여 'Gartner Hype Cycle for Artificial Intelligence, 2021'의 단계별 기술들에 대한 집단구조(커뮤니티)의 특성과 커뮤니티 간 정보 확산패턴을 분석하고자 한다. 이를 위해 컴포넌트 응집규모(Component Cohesion Size)를 통해 각 단계별 구조적 특성과 연결중심화(Degree Centralization)와 밀도(Density)를 통해 확산의 방식을 확인하였다. 연구결과 기술을 수용하는 단계별 집단들의 커뮤니케이션 활동이 시간이 지날 수록 분절이 커지며 밀도 역시 감소함을 확인하였다. 또한 새로운 기술에 대한 관심을 촉발하는 혁신태동기 집단의 경우 정보확산을 촉발하는 외향연결(Out-degree) 중심화 지수가 높았으며, 이후의 단계는 정보를 수용하는 내향연결(In-degree) 중심화 지수가 높은 것으로 나타났다. 해당 연구를 통해 하이프 사이클에 관한 이론적 기초를 제공할 것이다. 또한 인공지능기술에 대한 기술관심집단들의 기대감을 반영한 정보확산의 특성과 패턴을 소셜데이터를 통해 분석함으로써 기업의 기술투자 의사결정에 새로운 시각을 제공할 것이다.

청소년의 인터넷 중독 : 수면, 우울과의 관련성 (Internet Addiction in Adolescents and its Relation to Sleep and Depression)

  • 송호광;정미향;성다정;정정경;최진숙;장용이;이진성
    • 수면정신생리
    • /
    • 제17권2호
    • /
    • pp.100-108
    • /
    • 2010
  • 목 적: 컴퓨터의 보급으로 인터넷 사용이 보편화되면서 인터넷 중독에 대한 관심이 증가하고 있다. 그러나 인터넷 중독의 정확한 병태생리에 대한 이해와 진단 기준은 아직 확립되어 있지 않다. 청소년은 발달 과정 중에 있기 때문에 인터넷 중독에 더 취약할 가능성이 있으며, 우울감과 수면 문제에 대한 이해가 중요하다. 본 연구에서는 청소년의 인터넷 중독, 수면 양상, 그리고 우울감의 특징과 그 연관성을 살펴보고자 하였다. 방 법:서울 시내 일 중, 고등학교의 중학교 2학년(155명), 고등학교 1, 2학년 학생(644명)을 대상으로 하였고 그 중 696명의 설문지를 분석 대상으로 하였다. 설문지에는 Young 인터넷 중독 척도(Young's Internet Addiction Scale, YI-AS), 피츠버그 수면의 질 척도(Pittsburgh Sleep Quality In-dex, PSQI), 우울감 척도(The Center for Epidemiologic Studies Depression Scale, CES-D), 그리고 인터넷 사용 패턴과 기본적인 인구학적 정보에 대한 질문들이 포함되었다. 연구 대상자들을 학년별, YIAS 점수에 따라 나누어 비교하였고, YIAS와 다른 변인과의 상관관계를 분석하였다(two-tailed, p<0.05). 결 과: 인터넷 중독군(internet-addicted, IA)은 14명(2.0%), 과사용군(over-using, ou)은 193명(27.7%), 비중독군(not-addicted, NA)군은 489명(70.3%) 이었으며, 전체 대상군의 평균 IAS 점수는 35.24점, PSQI 점수는 5.53점, CES-D 점수는 16.72점이었다. 평일 평균적인 수면 시간은 학년이 올라가면서 점점 감소하였다(F=51.909, p< 0.001). IA군, OU군, NA군으로 나누어 비교하였을 때 컴퓨터를 공부 이외의 목적으로 사용하는 시간(96.36${\pm}$63.31분 vs. 134.92${\pm}$86.79분 vs. 213.57${\pm}$136.87분, F=34.287, p<0.001), 휴대용 전자기기를 공부 이외의 목적으로 사용하는 시간(84.22${\pm}$79.11분 vs. 96.97${\pm}$91.89분 vs. 152.31${\pm}$93.64분, F=5.400, p=0.005)에 유의한 차이가 있었다. PSQI 총점(5.26${\pm}$2.97 vs. 6.08${\pm}$2.97 vs. 7.50${\pm}$4.41, F= 8.218, p<0.001)과 CES-D 점수(15.40${\pm}$8.08 vs. 19.05${\pm}$8.42 vs. 30.43${\pm}$13.69, F=32.692, p<0.001)에서도 유의한 차이가 있었다. YIAS 점수는 컴퓨터를 공부 이외의 목적으로 사용하는 시간(r=0.356, p${\pm}$0.001), 휴대용 전자기기를 공부 이외의 목적으로 사용하는 시간(r=0.136, p<0.001)과 유의한 상관관계가 있었다. YIAS 점수와 PSQI 점수(r= 0.131, p=0.001), YIAS 점수와 CES-D 점수(r=0.265, p< 0.001), PSQI 점수와 CES-D 점수(r=0.357, p<0.001)는 서로 유의한 상관관계가 있었다. 결 론: 인터넷 중독은 행위 중독의 한 가지로 여러 정신병리와 관련이 있을 뿐만 아니라, 수면의 질을 결정하는 여러 가지 요인들, 우울감과도 밀접한 관련이 있다는 것을 알 수 있었다. 따라서 청소년의 인터넷 중독을 평가할 때 동반될 우울감과 수면 양상에 대한 고려가 함께 이루어지는 통합적인 접근이 필요할 것이다.

  • PDF

$[^{18}F]FDG$ 소동물 PET과 CT를 이용한 폐 전이 종양 마우스 모델의 영상화 (Imaging of Lung Metastasis Tumor Mouse Model using $[^{18}F]FDG$ Small Animal PET and CT)

  • 김준엽;우상근;이태섭;김경민;강주현;우광선;정위섭;정재호;천기정;최창운;임상무
    • Nuclear Medicine and Molecular Imaging
    • /
    • 제41권1호
    • /
    • pp.42-48
    • /
    • 2007
  • 목적: 이 연구에서는 폐 전이 종양을 영상화하기 위하여 흑색종의 폐 전이 종양 마우스 모델을 제작하고 영상 획득 전처리 조건을 개선하여 폐 전이 종양의 $[^{18}F]FDG$ 소동물 PET 영상을 획득하고자 하였으며, 임상 CT를 이용하여 전이 종양의 해부학적 위치를 확인하고자 하였다. 대상 및 방법: 정상 마우스의 $[^{18}F]$FDG 영상 획득 전 조건은 $16{\sim}22$시간 금식 하고 $30^{\circ}C$의 온도를 유지하며 $[^{18}F]FDG$ (7.4 MBq) 정맥 주사 후 서로 다른 마취제(Ketamine/Xylazine, Ke/Xy과 Isoflurane, Iso)로 $[^{18}F]FDG$ 섭취 60분 동안 유지한 후 20분간 $[^{18}F]FDG$ 소동물 PET 영상을 획득하였다. 혈중 포도당 농도를 보정한 포도당 표준 섭취 계수 영상을 이용하여 관심영역 대 배경비(lung to background ratio, L/B)를 구하여 평가하였다. C57BL/6 마우스에 B16-F10 세포를 정맥내 주사하여 제작한 폐전이 종양 마우스 모델은 정상 마우스의 영상 획득 조건과 동일한 조건에서 $[^{18}F]FDG$ 소동물 PET 영상을 획득하였으며, 임상 CT를 이용하여 획득된 해부학적 영상으로 폐 부위의 종양 위치를 확인하였다. 결과: 정상 마우스의 평균 혈중 포도당 농도는 Ke/Xy으로 마취한 군에서 $128.0{\pm}23.87\;mg/dL$이었으며 Iso으로 마취한 군에서는 $86.0{\pm}21.65\;mg/dL$로, Ke/Xy으로 마취한 군이 Iso로 마취한 군 보다 1.5 배 높은 혈중 포도당 농도를 나타내었다. 포도당 표준 섭취 계수 영상에서의 L/B는 Ke/Xy으로 마취한 군에서 $8.6{\pm}0.48$ 이었으며 Iso으로 마취한 군에서는 $12.1{\pm}0.63$로, Iso로 마취한 군이 Ke/Xy으로 마취한 군 보다 주변 정상조직과의 대조도가 높은 경향을 보였다. 폐 전이 종양 마우스에서는 Iso로 마취한 군이 Ke/Xy으로 마취한 군의 $[^{18}F]FDG$ 소동물 PET 영상보다 주변 조직의 $[^{18}F]FDG$ 섭취가 낮았다. 또한 해부학적 종양의 위치를 확인하기 위하여 임상 CT 영상과 융합한 결과 폐 전이 종양이 폐 부위에 위치함을 확인하였다. 결론: 마우스와 같은 소동물에서의 폐 부위 종양을 $[^{18}F]FDG$로 영상화하는데 있어서 금식, 온도유지, $[^{18}F]FDG$ 섭취 시간 동안의 마취제 조건 등을 고려하여야 하며, $[^{18}F]FDG$ 소동물 PET과 CT 영상의 융합은 폐 부위의 전이 종양을 확인하는데 유용할 것으로 기대된다.

클로미펜에 얇은 자궁내막을 보이는 환자에서 성선자극호르몬 병합 과배란유도시 클로미펜과 레트로졸의 임상적 효용성 (Clinical Efficacy of Clomiphene Citrate and Letrozole Combined with Gonadotropins for Superovulation in Patients with Clomiphene-Induced Thin Endometrium)

  • 이은주;박현종;양효인;이경은;서석교;김혜연;조시현;최영식;이병석;박기현;조동제
    • Clinical and Experimental Reproductive Medicine
    • /
    • 제36권2호
    • /
    • pp.111-119
    • /
    • 2009
  • 목 적: 클로미펜을 사용한 배란유도시 얇은 자궁내막을 보였던 환자들에서 성선자극호르몬에 클로미펜 또는 레트로졸을 병합 투여하는 과배란유도 방법의 임상적 효용성을 비교 분석하고자 하였다. 연구방법: 이전의 클로미펜을 사용한 배란유도 주기에서 8 mm 미만의 얇은 자궁내막을 보였던 불임 환자들에서 시행된 성선자극호르몬 병합 과배란유도/인공수정 51주기가 연구에 포함되었다. 월경주기 제3일째부터 5일 동안 클로미펜+성선자극호르몬 군은 일일 클로미펜 100 mg을 투여하였고 (n=26) 레트로졸+성선자극호르몬 군은 일일 레트로졸 2.5 mg 또는 5 mg을 투여하였다 (n=25). 양 군에서 월경주기 제5~7일째부터 우성난포의 크기가 18 mm 이상에 도달할 때까지 이틀에 한 번씩 성선자극호르몬은 75~150 IU를 투여하였다. 양 군에서 성선자극호르몬 총 사용량, 자궁내막의 두께, 자궁내막의 형태, hCG 투여일의 14 mm 이상 난포의 수, hCG 투여일, 임신율, 다태 임신율을 비교하였으며 통계 분석은 Mann-Whitney U test or Fisher's exact test 등을 이용하였다. 결 과: 연령, 불임기간, 이전 인공수정 횟수, 기저 혈중 LH, FSH, $E_2$ 농도, 불임의 원인 등의 임상적 특성은 양 군간 차이가 없었다. 성선자극호르몬 병합 과배란유도시 배란전 자궁내막의 두께는 이전의 클로미펜을 사용한 주기와 비교하여 유의하게 증가되었다. 성선자극호르몬 총 사용량, hCG 투여일, 자궁내막의 삼중선 비율, 임신율 및 다태 임신율은 유의한 차이가 없었다. 클로미펜+성선자극호르몬 군에 비하여 레트로졸+성선자극호르몬 군에서 14 mm 이상 난포의 개수는 유의하게 적었고 ($3.7{\pm}1.7$ vs. $2.8{\pm}1.7$, p=0.03). 배란 전 자궁내막 두께는 유의하게 두꺼웠다 ($7.7{\pm}1.5\;mm$ vs. $9.1{\pm}1.7\;mm$, p<0.05). 결 론: 배란유도를 위하여 클로미펜 사용시 얇은 자궁내막을 보였던 환자들에서 인공수정을 위한 과배란유도시클로미펜 또는 레트로졸을 성선자극호르몬과 병합하여 사용하는 방법은 클로미펜의 자궁내막에 대한 부정적인 효과를 피할 수 있는 것으로 사료된다. 적절한 자궁내막의 발달 및 적절한 난포의 성장 측면에서 성선자극호르몬에 레트로졸을 병합하는 과배란유도 방법이 클로미펜을 병합하는 방법에 비하여 더 유용할 수 있으나 추가적인 대규모 전향적 연구가 필요할 것으로 사료된다.

Hybrid CNN-LSTM 알고리즘을 활용한 도시철도 내 피플 카운팅 연구 (A Study on People Counting in Public Metro Service using Hybrid CNN-LSTM Algorithm)

  • 최지혜;김민승;이찬호;최정환;이정희;성태응
    • 지능정보연구
    • /
    • 제26권2호
    • /
    • pp.131-145
    • /
    • 2020
  • 산업혁신의 흐름에 발맞추어 다양한 분야에서 활용되고 있는 IoT 기술은 빅데이터의 접목을 통한 새로운 비즈니스 모델의 창출 및 사용자 친화적 서비스 제공의 핵심적인 요소로 부각되고 있다. 사물인터넷이 적용된 디바이스에서 누적된 데이터는 사용자 환경 및 패턴 분석을 통해 맞춤형 지능 시스템을 제공해줄 수 있어 편의 기반 스마트 시스템 구축에 다방면으로 활용되고 있다. 최근에는 이를 공공영역 혁신에 확대 적용하여 CCTV를 활용한 교통 범죄 문제 해결 등 스마트시티, 스마트 교통 등에 활용하고 있다. 그러나 이미지 데이터를 활용하는 기존 연구에서는 개인에 대한 사생활 침해 문제 및 비(非)일반적 상황에서 객체 감지 성능이 저하되는 한계가 있다. 본 연구에 활용된 IoT 디바이스 기반의 센서 데이터는 개인에 대한 식별이 불필요해 사생활 이슈로부터 자유로운 데이터로, 불특정 다수를 위한 지능형 공공서비스 구축에 효과적으로 활용될 수 있다. 대다수의 국민들이 일상적으로 활용하는 도시철도에서의 지능형 보행자 트래킹 시스템에 IoT 기반의 적외선 센서 디바이스를 활용하고자 하였으며 센서로부터 측정된 온도 데이터를 실시간 송출하고, CNN-LSTM(Convolutional Neural Network-Long Short Term Memory) 알고리즘을 활용하여 구간 내 보행 인원의 수를 예측하고자 하였다. 실험 결과 MLP(Multi-Layer Perceptron) 및 LSTM(Long Short-Term Memory), RNN-LSTM(Recurrent Neural Network-Long Short Term Memory)에 비해 제안한 CNN-LSTM 하이브리드 모형이 가장 우수한 예측성능을 보임을 확인하였다. 본 논문에서 제안한 디바이스 및 모델을 활용하여 그간 개인정보와 관련된 법적 문제로 인해 서비스 제공이 미흡했던 대중교통 내 실시간 모니터링 및 혼잡도 기반의 위기상황 대응 서비스 등 종합적 메트로 서비스를 제공할 수 있을 것으로 기대된다.

주가지수 방향성 예측을 위한 주제지향 감성사전 구축 방안 (Predicting the Direction of the Stock Index by Using a Domain-Specific Sentiment Dictionary)

  • 유은지;김유신;김남규;정승렬
    • 지능정보연구
    • /
    • 제19권1호
    • /
    • pp.95-110
    • /
    • 2013
  • 최근 다양한 소셜미디어를 통해 생성되는 비정형 데이터의 양은 빠른 속도로 증가하고 있으며, 이를 저장, 가공, 분석하기 위한 도구의 개발도 이에 맞추어 활발하게 이루어지고 있다. 이러한 환경에서 다양한 분석도구를 통해 텍스트 데이터를 분석함으로써, 기존의 정형 데이터 분석을 통해 해결하지 못했던 이슈들을 해결하기 위한 많은 시도가 이루어지고 있다. 특히 트위터나 페이스북을 통해 실시간에 근접하게 생산되는 글들과 수많은 인터넷 사이트에 게시되는 다양한 주제의 글들은, 방대한 양의 텍스트 분석을 통해 많은 사람들의 의견을 추출하고 이를 통해 향후 수익 창출에 기여할 수 있는 새로운 통찰을 발굴하기 위한 움직임에 동기를 부여하고 있다. 뉴스 데이터에 대한 오피니언 마이닝을 통해 주가지수 등락 예측 모델을 제안한 최근의 연구는 이러한 시도의 대표적 예라고 할 수 있다. 우리가 여러 매체를 통해 매일 접하는 뉴스 역시 대표적인 비정형 데이터 중의 하나이다. 이러한 비정형 텍스트 데이터를 분석하는 오피니언 마이닝 또는 감성 분석은 제품, 서비스, 조직, 이슈, 그리고 이들의 여러 속성에 대한 사람들의 의견, 감성, 평가, 태도, 감정 등을 분석하는 일련의 과정을 의미한다. 이러한 오피니언 마이닝을 다루는 많은 연구는, 각 어휘별로 긍정/부정의 극성을 규정해 놓은 감성사전을 사용하며, 한 문장 또는 문서에 나타난 어휘들의 극성 분포에 따라 해당 문장 또는 문서의 극성을 산출하는 방식을 채택한다. 하지만 특정 어휘의 극성은 한 가지로 고유하게 정해져 있지 않으며, 분석의 목적에 따라 그 극성이 상이하게 나타날 수도 있다. 본 연구는 특정 어휘의 극성은 한 가지로 고유하게 정해져 있지 않으며, 분석의 목적에 따라 그 극성이 상이하게 나타날 수도 있다는 인식에서 출발한다. 동일한 어휘의 극성이 해석하는 사람의 입장에 따라 또는 분석 목적에 따라 서로 상이하게 해석되는 현상은 지금까지 다루어지지 않은 어려운 이슈로 알려져 있다. 구체적으로는 주가지수의 상승이라는 한정된 주제에 대해 각 관련 어휘가 갖는 극성을 판별하여 주가지수 상승 예측을 위한 감성사전을 구축하고, 이를 기반으로 한 뉴스 분석을 통해 주가지수의 상승을 예측한 결과를 보이고자 한다.

의존 구문 분석을 이용한 질의 기반 정답 추출 (Query-based Answer Extraction using Korean Dependency Parsing)

  • 이도경;김민태;김우주
    • 지능정보연구
    • /
    • 제25권3호
    • /
    • pp.161-177
    • /
    • 2019
  • 질의응답 시스템은 크게 사용자의 질의를 분석하는 방법인 질의 분석과 문서 내에서 적합한 정답을 추출하는 방법인 정답 추출로 이루어지며, 두 방법에 대한 다양한 연구들이 진행되고 있다. 본 연구에서는 문장의 의존 구문 분석 결과를 이용하여 질의응답 시스템 내 정답 추출의 성능 향상을 위한 연구를 진행한다. 정답 추출의 성능을 높이기 위해서는 문장의 문법적인 정보를 정확하게 반영할 필요가 있다. 한국어의 경우 어순 구조가 자유롭고 문장의 구성 성분 생략이 빈번하기 때문에 의존 문법에 기반한 의존 구문 분석이 적합하다. 기존에 의존 구문 분석을 질의응답 시스템에 반영했던 연구들은 구문 관계 정보나 구문 형식의 유사도를 정의하는 메트릭을 사전에 정의해야 한다는 한계점이 있었다. 또 문장의 의존 구문 분석 결과를 트리 형태로 표현한 후 트리 편집 거리를 계산하여 문장의 유사도를 계산한 연구도 있었는데 이는 알고리즘의 연산량이 크다는 한계점이 존재한다. 본 연구에서는 구문 패턴에 대한 정보를 사전에 정의하지 않고 정답 후보 문장을 그래프로 나타낸 후 그래프 정보를 효과적으로 반영할 수 있는 Graph2Vec을 활용하여 입력 자질을 생성하였고, 이를 정답 추출모델의 입력에 추가하여 정답 추출 성능 개선을 시도하였다. 의존 그래프를 생성하는 단계에서 의존 관계의 방향성 고려 여부와 노드 간 최대 경로의 길이를 다양하게 설정하며 자질을 생성하였고, 각각의 경우에 따른 정답추출 성능을 비교하였다. 본 연구에서는 정답 후보 문장들의 신뢰성을 위하여 웹 검색 소스를 한국어 위키백과, 네이버 지식백과, 네이버 뉴스로 제한하여 해당 문서에서 기존의 정답 추출 모델보다 성능이 향상함을 입증하였다. 본 연구의 실험을 통하여 의존 구문 분석 결과로 생성한 자질이 정답 추출 시스템 성능 향상에 기여한다는 것을 확인하였고 해당 자질을 정답 추출 시스템뿐만 아니라 감성 분석이나 개체명 인식과 같은 다양한 자연어 처리 분야에 활용 될 수 있을 것으로 기대한다.

이차원 고객충성도 세그먼트 기반의 고객이탈예측 방법론 (A Methodology of Customer Churn Prediction based on Two-Dimensional Loyalty Segmentation)

  • 김형수;홍승우
    • 지능정보연구
    • /
    • 제26권4호
    • /
    • pp.111-126
    • /
    • 2020
  • CRM의 하위 연구 분야로 진행되었던 고객이탈예측은 최근 비즈니스 머신러닝 기술의 발전으로 인해 빅데이터 기반의 퍼포먼스 마케팅 주제로 더욱 그 중요도가 높아지고 있다. 그러나, 기존의 관련 연구는 예측 모형 자체의 성능을 개선시키는 것이 주요 목적이었으며, 전체적인 고객이탈예측 프로세스를 개선하고자 하는 연구는 상대적으로 부족했다. 본 연구는 성공적인 고객이탈관리가 모형 자체의 성능보다는 전체 프로세스의 개선을 통해 더 잘 이루어질 수 있다는 가정하에, 이차원 고객충성도 세그먼트 기반의 고객이탈예측 프로세스 (CCP/2DL: Customer Churn Prediction based on Two-Dimensional Loyalty segmentation)를 제안한다. CCP/2DL은 양방향, 즉 양적 및 질적 로열티 기반의 고객세분화를 시행하고, 고객세그먼트들을 이탈패턴에 따라 2차 그룹핑을 실시한 뒤, 이탈패턴 그룹별 이질적인 이탈예측 모형을 독립적으로 적용하는 일련의 이탈예측 프로세스이다. 제안한 이탈예측 프로세스의 상대적 우수성을 평가하기 위해 기존의 범용이탈예측 프로세스와 클러스터링 기반 이탈예측 프로세스와의 성능 비교를 수행하였다. 글로벌 NGO 단체인 A사의 협력으로 후원자 데이터를 활용한 분석과 검증을 수행했으며, 제안한 CCP/2DL의 성능이 다른 이탈예측 방법론보다 우수한 성능을 보이는 것으로 나타났다. 이러한 이탈예측 프로세스는 이탈예측에도 효과적일 뿐만 아니라, 다양한 고객통찰력을 확보하고, 관련된 다른 퍼포먼스 마케팅 활동을 수행할 수 있는 전략적 기반이 될 수 있다는 점에서 연구의 의의를 찾을 수 있다.

흉선종양에서의 WHO 분류와 Masaoka 병기, 임상양상간의 상관관계연구 (Prognostic Relevance of WHO Classification and Masaoka Stage in Thymoma)

  • 강성식;천미순;김용희;박승일;엄대운;노재윤;김동관
    • Journal of Chest Surgery
    • /
    • 제38권1호
    • /
    • pp.44-49
    • /
    • 2005
  • 흥선종양은 비교적 흔한 종격종 종양이나 이제까지 병리학적 분류가 통일된 것이 없었으며 또한 치료 및 예후와의 연관성이 잘 확립되어 있지 않았다. 최근에서야 WHO 분류가 발표되었고 이에 따른 치료 계획과 치료에 따른 예후와의 상관관계가 보고되기 시작했다. 본 연구는 WHO 분류와 Masaoka병기 그리고 임상양상 간의 상관관계를 조사하였다. 대상 및 방법: 대상환자는 서울아산병원 흉부외과에서 1993년 1월부터 2003년 6월까지 완전절제술을 시행 받았던 흥선종양 환자 98명으로 하였다. WHO 분류의 조사를 위하여 병리조직 slide를 다시 검토하였으며 수술 후 Masaoka병기와의 관련성, 술 후 추가적인 치료와 예후에 대한 관계 및 재발여부에 관하여 의무기록 조사를 통하여 후향적으로 조사하였다. 결과: 98예의 대상 환자 중 남녀 비는 48 : 50이었으며 수술 연령은 평균 $49.6{\pm}13.9$세였다. WHO 분류에 따르면 type A 6명, AB 14명, B1 18명, B2 23명, B3 18명, C 9명이었다. Masaoka 병기와 WHO 분류와의 관계를 보면 Masaoka 병기 I 53명 $(54{\%})$ 중에서 WHO type A 4명, AB 7명, B1 22명, B2 17명, B3 3명이었으며 Masaoka 병기 II 28명$(28.5{\%})$ 중에서는 WHO type A 2명, AB 7명, B1 4명, B2 2명, B3 8명, C 5명이었고 Masaoka병기 III 15명$(15.3{\%})$ 중에서는 WHO type B1 L명, B2 3명, B3 7명, C 4명이었으며 Masaoka병기 IV 2명$(2{\%})$ 중에서는 WHO type B1 1명, B2 1명이었다. 평균 추적 기간은 $28{\pm}6.8$개월이었다. 사망 환자는 3명으로 type B2에서 2명(Masaoka 병기 III, IV), 그리고 type C에서 1명(Masaoka병기 II)이었다 재발 후 생존해 있는 환자는 총 6명이었으며 이 중 type B2에서 2명(Masaoka 병기 III), type B3에서 2명(Masaoka 병기 I, III) type C에서 2명(Masaoka 병기 II)이었다. Kaplan-Meier방법으로 통계 처리한 결과 WHO분류상 type B2에서 5년 생존율은 $90{\%}$ 였으며 type C에서 5년 생존율은 $87.5{\%}$였다. 재발률을 보면 class B2에서 5년 무병 생존율 $80.7{\%}$, B3에서 $81.6{\%}$, C에서 $50{\%}$였다. Log-Rank 방법에서 보면 WHO분류와 생존율, 재발률 사이에 통계학적으로 상관관계가 있는 것으로 나타났다(p<0.05). WHO 분류와 Masaoka분류의 상관 관계를 보면 Spearman correction method출 이용한 통계에서 상관관계 곡선이 slope=0.401 (p=0.023)으로 밀접한 관계가 있다고 하겠다. 결론: WHO분류의 type C의 경우 수술 후 재발률과 사망률이 높으므로 수술 후보다 적극적인 치료와 추적관찰이 필요할 것으로 생각된다. WHO분류와 Masaoka 병기간에는 상호 밀접한 관계가 있는 것으로 생각되며 WHO분류 및 Masaoka병기 모두 흥선종의 예후의 예측 인자가 될 수 있을 것으로 생각된다.