• 제목/요약/키워드: log data analysis

검색결과 975건 처리시간 0.03초

텍스트 마이닝 기반의 이슈 관련 R&D 키워드 패키징 방법론 (Methodology for Issue-related R&D Keywords Packaging Using Text Mining)

  • 현윤진;윌리엄;김남규
    • 인터넷정보학회논문지
    • /
    • 제16권2호
    • /
    • pp.57-66
    • /
    • 2015
  • 빅데이터 기술에 대한 관심이 급증함에 따라, 소셜 미디어를 통해 유통되는 방대한 양의 비정형 데이터를 분석하고자 하는 시도가 활발히 이루어지고 있다. 이에 따라서 텍스트 형태의 비정형 데이터 분석을 통해 의미 있는 정보를 찾고자 하는 시도가 비즈니스 영역뿐 아니라, 정치, 경제, 문화 등 다양한 영역에서 이루어지고 있다. 특히 최근에는 여러 현안 및 이슈들을 발굴하여 이를 의사결정에 활용하고자 하는 시도가 활발히 이루어지고 있다. 이처럼 빅데이터 분석을 통해 국가현안이나 이슈를 발굴하고자 하는 시도가 꾸준히 이루어져왔음에도 불구하고, 국가현안 및 이슈로부터 이와 관련된 R&D 문서를 효율적으로 제공하는 방안은 마련되지 않고있다. 이는 사용자들이 인식하는 현안 키워드와 실제 사용되는 R&D 키워드 사이의 이질성이 존재하기 때문이다. 따라서 현안 및 R&D키워드간의 이질성을 극복하기 위한 중간 장치가 필요하며, 이 중간 장치를 통해 각 현안 키워드와 R&D 키워드간에 적절한 대응이 이루어져야 한다. 이를 위해 본 연구에서는 (1) 현안 키워드 추출을 위한 하이브리드 방법론, (2) 현안 대응 R&D 정보 패키징 방법론, 그리고 (3) R&D 관점에서의 연관 현안 네트워크 구축 방법론의 총 세 가지 방법론을 제안한다. 제안하는 방법론은 텍스트 마이닝, 소셜네트워크 분석, 그리고 연관 규칙 마이닝 등의 데이터 분석 기법들을 활용하여 수행하였으며, 그 결과, (1)에 의한 키워드 보강률은 42.8%로 나타났으며, (2)의 경우, 현안 키워드와 R&D 키워드간 다수의 연관 규칙이 나타났다. (3)의 경우는 현재 진행 중에 있으며, 향후 가시적 성과를 낼 수 있을 것으로 예상된다.

어군탐지기에 의한 어군량 추정에 관한 기초적 연구 ( 2 ) - 어군의 분포밀도와 초음파산란강도의 관계 - (Studies on Estimation of Fish Abundance Using an Echo Sounder ( 2 ) - The Relationship between Acoustic Backscattering Strength and Distribution Density of Fish in a Net Cage-)

  • 이대재
    • 수산해양기술연구
    • /
    • 제27권1호
    • /
    • pp.13-20
    • /
    • 1991
  • 어군의 분포밀도와 초음파산란강도의 관계를 검토하기 위하여, 50kHz의 주파수에서 net cage (농망)에 분포밀도가 기지인 어군을 수용하고, 어군밀도의 변화에 기인하는 echo energy의 변동을 고찰하고, 또 cage 실험에 의해 추정한 어체의 평균적인 반사강도와 개개의 어체를 대상으로 구한 평균반사강도를 상호 비교, 검토한 결과를 요약하면 다음과 같다. 1. cage 실험에 의한 붕어의 평균반사강도는 -41.9dB로서, 이 값은 현장에서 개개의 붕어(마취어, 평균체장 19.1cm)를 대상으로 측정한 평균반사강도 -42.6dB보다 0.7dB 더 컸다. 2. cage내에 수용한 어군의 분포밀도가 증가함에 따라, 어군에 의한 평균체적산란강도는 직선적으로 증가하는 경향을 나타내었다. 즉, 어군밀도가 7, 13, 20, 26, 39, 52, 66 마리/m 상(3)였을 때, 각각의 어군에 의한 평균체적산란강도는 -33.0, -28.9, -27.6, -24.3, -25.1, -23.6, -22.1dB이었다. 3. 어군밀도 $\rho(마리/m$ 상(3))와 평균체적산란강도 (dB)와의 사이에는 다음의 관계식이 성립하였다. =-41.9+11.0 $Log(\rho),$ r=0.97 이 식에 회귀직선의 기울기 11은 이론적인 값 10에 거의 근사하였다.

  • PDF

정수장 응집혼화공정에서의 응집플럭 연속 모니터링 (On-line Monitoring of the Flocs in Mixing Zone using iPDA in the Drinking Water Treatment Plant)

  • 가길현;장현성;김영범;곽종운
    • 대한환경공학회지
    • /
    • 제31권4호
    • /
    • pp.263-271
    • /
    • 2009
  • 본 연구는 Y 정수장 혼화지의 응집효율을 향상시킬 목적으로 혼화지에서 생성되는 플럭을 실시간 온라인으로 평가하였다. 플럭크기를 평가하는 장비로는 온라인으로 플럭을 연속적으로 평가할 수 있는 응집플럭성장측정장치(iPDA)를 사용하였다. 플럭크기를 평가하기 위해 유기고분자 응집제인 폴리아민, 무기응집제 주입량, 원수의 탁도, pH같은 여러 가지 인자를 변수로 적용하였다. 현장실험 기간 동안 사용된 응집제는 폴리염화알루미늄(PACl)이었고, 응집보조재로 폴리아민이 사용되었다. 현장 테스트 기간 동안 원수의 탁도는 25~140 NTU 범위, pH는 7~9이었다. 원수의 탁도가 증가할수록 생성되는 플럭의 크기도 증가 하여 침전속도에 영향을 미쳤다. 회귀선분석으로 부터 FSI (Floc size index)와 탁도 T 값과의 관계식을 다음과 같이 얻었다. FSI = 0.9388logT - 0.3214 ($R^2$ = 0.8040, T : Turbidity) 또한 보조제로 사용된 폴리아민도 플럭크기값에 큰 영향을 주었고, 색도제거제로 사용된 활성탄(PAC)도 그 자체 입자로 작용하여 응집플럭크기 값에 영향을 상당히 주는 것으로 나타났다. 고탁도인 경우 FSI는 [PACl]과 [PAC]함수로 다음과 같은 식을 유도할 수 있었으며 $R^2$ = 0.9050이었다. FSI = $0.0407[T]^{0.324}[PACI]^{0.769}[PAC]^{0.178}$ [PACl] = PACl 주입농도, [PAC] = 활성탄 주입농도 상대적 응집속도 ${\Delta}FST/{\Delta}T$ 값은 응집제의 주입량보다는 활성탄의 주입량이 더 큰 영향을 주었다. 본 연구과정에서 활성탄주입량이 응집속도에 미치는 영향은 응집제의 주입농도가 미치는 것보다 ${\Delta}FST/{\Delta}T$ 값이 1.41 배 큰 것으로 나타났다. 본 연구에서 연구한 결과 플럭크기값 FSI는 여러 가지 영향인자에 상당한 영향을 받는 것으로 분석되었고, 집혼화 효율향상에 유익한 데이터를 얻을 수 있었다.

NGC 7790의 UBVI CCD 측광 (UBVI CCD Photometry of NGC 7790)

  • 최동열;김희수;임범두;성환경
    • 한국지구과학회지
    • /
    • 제36권7호
    • /
    • pp.661-673
    • /
    • 2015
  • 우즈베키스탄 Maidanak 천문대 AZT-22 1.5 m 망원경(f/7.74)과 SITe $2000{\times}800$CCD를 사용하여 3개의 ${\delta}$ Cep 변광성 CEa Cas, CEb Cas 및 CF Cas가 있는 중년 산개성단 NGC 7790의 UBVI 측광 관측을 수행하였다. 관측자료는 IRAF/DAOPHOT를 이용하여 PSF 측광을 수행하였으며, V와 I 필터에서 모두 측광된 별의 수는 총 1008개이며, 측광의 한계등급은 $V{\approx}22$등급이다. 대기소광계수 및 측광영점을 결정하기 위하여 천구적도에 있는 여러 표준별과 청색 및 적색 표준별을 다양한 대기투과량에서 관측하였다. 표준별 측광을 통해 대기소광계수 및 측광영점을 결정하고, 성단의 측광자료는 Johnson-Cousins UBVI 표준계로 변환하였다. NGC 7790의 UBVI 색-등급도와 색-색도에서 이 성단의 B와 V 필터에서의 색초과량 [$E(B-V)=0.58{\pm}0.02$], B와 V 필터에서의 선택적 소광량 [$R_V{{\equiv}}A_V/E(B-V)=3.02{\pm}0.09$] 및 거리지수($V_0-M_V=12.65{\pm}0.10$)를 얻었다. H-R도에서 세페이드 변광성의 위치를 고려하여 나이를 결정하였다. 이 과정에서 Padova 연구집단(Bressan et al., 2012)의 등연령곡선(Z=0.019)과 Geneva 연구집단($Ekstr{\ddot{o}}m$ et al., 2012)의 등연령곡선(Z=0.014)을 모두 사용하였고, 그중에서 자전을 고려한 Geneva 연구집단의 진화모형이 관측자료와 잘 일치하여 NGC 7790의 나이로 log $age=8.05{\pm}0.05$ [yr]를 얻었다. 또 NGC 7790내 세페이드 변광성의 절대등급은 세페이드 변광성의 평균 주기-광도 관계에 비해 분산 범위 내에 있기는 하지만 주어진 주기에서 평균적으로 약 0.5등급 정도 밝음을 확인하였다.

이미지 감성분류를 위한 CNN과 K-means RGB Cluster 이-단계 학습 방안 (A Two-Stage Learning Method of CNN and K-means RGB Cluster for Sentiment Classification of Images)

  • 김정태;박은비;한기웅;이정현;이홍주
    • 지능정보연구
    • /
    • 제27권3호
    • /
    • pp.139-156
    • /
    • 2021
  • 이미지 분류에서 딥러닝 모형을 사용하는 가장 큰 이유는 이미지의 전체적인 정보에서 각 지역 특징을 추출하여 서로의 관계를 고려할 수 있기 때문이다. 하지만 이미지의 지역 특징이 없는 감정 이미지 데이터는 CNN 모델이 적합하지 않을 수 있다. 이러한 감정 이미지 분류의 어려움을 해결하기 위하여 매년 많은 연구자들이 감정 이미지에 적합한 CNN기반 아키텍처를 제시하고 있다. 색깔과 사람 감정간의 관계에 대한 연구들도 수행되었으며, 색깔에 따라 다른 감정이 유도된다는 결과들이 도출되었다. 딥러닝을 활용한 연구에서도 색깔정보를 활용하여 이미지 감성분류에 적용하는 연구들이 있어왔으며, 이미지만을 가지고 분류 모형을 학습한 경우보다 이미지의 색깔 정보를 추가로 활용한 경우가 이미지 감성 분류 정확도를 더 높일 수 있었다. 본 연구는 사람이 이미지의 감정을 분류하는 기준 중 많은 부분을 차지하는 색감을 이용하여 이미지 감성 분류 정확도를 향상시키는 방안을 제안한다. 이미지의 RGB 값에 K 평균 군집화 방안을 적용하여 이미지를 대표하는 색을 추출하여, 각 감성 클래스 별 해당 색깔이 나올 확률을 가중치 식으로 변형 후 CNN 모델의 최종 Layer에 적용하는 이-단계 학습방안을 구현하였다. 이미지 데이터는 6가지 감정으로 분류되는 Emotion6와 8가지 감정으로 분류되는 Artphoto를 사용하였다. 학습에 사용한 CNN 모델은 Densenet169, Mnasnet, Resnet101, Resnet152, Vgg19를 사용하였으며, 성능 평가는 5겹 교차검증으로 CNN 모델에 이-단계 학습 방안을 적용하여 전후 성과를 비교하였다. CNN 아키텍처만을 활용한 경우보다 색 속성에서 추출한 정보를 함께 사용하였을 때 더 좋은 분류 정확도를 보였다.

가시·근적외 분광 스펙트럼을 이용한 토양 이화학성 추정 (Quantification of Soil Properties using Visible-NearInfrared Reflectance Spectroscopy)

  • 최은영;홍석영;김이현;송관철;장용선
    • 한국토양비료학회지
    • /
    • 제42권6호
    • /
    • pp.522-528
    • /
    • 2009
  • 농경지에서 채취한 30개의 토양 Profile에 대해 깊이별로 채취한 시료를 이용하여 pH, CEC, Ca, Mg, Org.C항목에 대해 분광 스펙트럼과 화학분석에 의한 토양 특성값의 통계적 정량화를 수행하였다. 추정모델의 신뢰도를 높이기 위해 원시 반사 스펙트럼 외에도 Log, 도함수, Continuum 제거 등의 변환을 거친 스펙트럼을 입력변수로 이용하였고 그 중에서CR스펙트럼은 각 토양 특성 항목과 일괄 추정, 유형별 추정식의 모든 경우에서 통계적 유의성을 가진 추정 결과를 보였다. 특정 토양 특성 항목에서는 다른 변환 스펙트럼이 더 유의한 결과를 나타내었지만, 동시 다항목 분석을 하는 경우 CR 스펙트럼을 이용하는 것이 분석의 신속성과 용이성을 제공할 것으로 사료된다. 추정모델 성능 향상을 위해 토양의 여러 특성에 의한 스펙트럼의 변화 중에서 큰 요인 중 하나인 토색과 관련된 Fe에 의한 500-1200 nm 영역에서의 흡수 스펙트럼 특징에 의해 유형을 나누어 추정모델을 도출하였다. 유형별 추정모델 적용 결과가 일괄 추정값보다 월등히 높은 결과를 나타내지는 않았지만, 대체적으로 유형별 추정모델이 약간 높은 유의성을 나타내었고, 특히 Ca와 CEC의 경우 상당히 향상된 결과를 보였다. 이러한 스펙트럼의 처리와 스펙트럼의 유형 분류 등을 고려한 정량 추정 모델을 통해 가시 근적 외 영역의 스펙트럼을 이용하여 토양의 특성을 동시에 다항목에 대한 분석을 신속하게 수행할 수 있을 것으로 판단된다. 이러한 추정 모델은 토양 특성에 대해 광역 단위에서 다량의 시료 분석에 유용하므로 지역, 세계 규모의 디지털 토양 매핑, 토양 분류 및 원격탐사 자료와의 연계 분석에 활용될 수 있을 것으로 사료된다.

교통조건, 기하구조 조건 및 검지기 설치위치에 따른 실시간신호제어시스템 포화도 산출방식 진단 (Diagnosis on Degree of Saturation Model of COSMOS Affected by Geometric and Detection Conditions and Detector Placements)

  • 김준용;김진태
    • 대한교통학회지
    • /
    • 제34권1호
    • /
    • pp.81-94
    • /
    • 2016
  • 교통신호를 가변 운영하는 실시간신호제어시스템은 방향별 움직임 포화도 추정을 위해 이론 기반 모형을 활용하나, 현장구축 실무에선 지침 부재로 모형에 고려되지 않은 운영상황에도 시스템을 설치하여 왔다. 본 연구는 서울시 실시간신호제어시스템 서버 운영 이력자료를 활용하여 교통조건, 기하구조 조건, 검지기 설치위치 등 현장여건에 따른 실시간신호제어시스템 포화도 모형의 포화도 추정 패턴을 진단한다. 총 476,505 신호주기 이력자료를 분석하여 직진 움직임 포화도를 진단한 결과 (1) 검지기가 모든 직진차로에 설치될 때 일부차로에 표본 설치되는 상황보다 포화도 추정이 안정적으로 판단되고, (2) 가로변버스전용차로가 존재하는 경우는 오히려 검지기를 일부 차로 표본 설치하는 것이 안정적으로 분석되며, (3) 공유차로 포함 차로군 검지기가 활용되는 경우 차량간섭으로 인해 포화도 추정이 정상적이지 않은 것으로 분석되고, (4) 검지기가 전용차로에 설치되더라도 공유차로에 인접한 경우도 차량간섭에 지속 영향 받아 포화도 추정이 어렵고, (5) 하루 24시간 중 특정시간은 교통흐름 속성에 따라 포화도 추정이 안정적이지 않을 수 있다는 내용이 진단되었다. 이러한 진단결과를 종합하여 향후 포화도 추정모형 개발단계 및 시스템 현장구축 단계에서 참조 가능한 기술발전 방향을 제언한다.

BVI PHOTOMETRIC STUDY OF THE OLD OPEN CLUSTER RUPRECHT 6

  • Kim, Sang Chul;Kyeong, Jaemann;Park, Hong Soo;Han, Ilseung;Lee, Joon Hyeop;Moon, Dae-Sik;Lee, Youngdae;Kim, Seongjae
    • 천문학회지
    • /
    • 제50권3호
    • /
    • pp.79-92
    • /
    • 2017
  • We present a BV I optical photometric study of the old open cluster Ruprecht 6 using the data obtained with the SMARTS 1.0 m telescope at the CTIO, Chile. Its color-magnitude diagrams show the clear existence of the main-sequence stars, whose turn-off point is located around $V{\approx}18.45mag$ and $B-V{\approx}0.85mag$. Three red clump (RC) stars are identified at V = 16.00 mag, I = 14.41 mag and B - V = 1.35 mag. From the mean $K_s-band$ magnitude of RC stars ($K_s=12.39{\pm}0.21mag$) in Ruprecht 6 from 2MASS photometry and the known absolute magnitudes of the RC stars ($M_{K_S}=-1.595{\pm}0.025mag$), we obtain the distance modulus to Ruprecht 6 of $(m-M)_0=13.84{\pm}0.21mag$ ($d=5.86{\pm}0.60kpc$). From the ($J-K_s$) and (B - V ) colors of the RC stars, comparison of the (B - V ) and (V - I) colors of the bright stars in Ruprecht 6 with those of the intrinsic colors of dwarf and giant stars, and the PARSEC isochrone fittings, we derive the reddening values of E(B - V ) = 0.42 mag and E(V - I) = 0.60 mag. Using the PARSEC isochrone fittings onto the color-magnitude diagrams, we estimate the age and metallicity to be: $log(t)=9.50{\pm}0.10(t=3.16{\pm}0.82Gyr)$ and $[Fe/H]=-0.42{\pm}0.04dex$. We present the Galactocentric radial metallicity gradient analysis for old (age > 1 Gyr) open clusters of the Dias et al. catalog, which likely follow a single relation of $[Fe/H]=(-0.034{\pm}0.007)R_{GC}+(0.190{\pm}0.080)$ (rms = 0.201) for the whole radial range or a dual relation of $[Fe/H]=(-0.077{\pm}0.017)R_{GC}+(0.609{\pm}0.161)$ (rms = 0.152) and constant ([Fe/H] ~ -0.3 dex) value, inside and outside of RGC ~ 12 kpc, respectively. The metallicity and Galactocentric radius ($13.28{\pm}0.54kpc$) of Ruprecht 6 obtained in this study seem to be consistent with both of the relations.

정상인의 요중 수은배설량 추정의 통계학적 연구 (Some Statistical Considerations for the Estimation of Urinary Mercury Excretion in Normal Individuals)

  • 박희숙;정규철
    • Journal of Preventive Medicine and Public Health
    • /
    • 제13권1호
    • /
    • pp.27-34
    • /
    • 1980
  • Purpose of this study is to find out proper means of estimating the urinary mercury excretion in the normal individuals. Whole void volume was collected every 2 hours beginning from 6 o'clock in the morning until 6 o'clock next morning. Mercury excretion in each urine specimen was measured by NIOSH recommended dithizone colorimetric method (Method No.: P & CAM 145). Urinary concentration of mercury was adjusted by two means: specific gravity of 1.024 and a gram of creatinine excretion per liter of urine comparing the data with the unadjusted ones. Mercury excretion in 24-hour urine specimen was calculated by adding the amounts measured with the hourly collected specimens of each individual. Statistical analysis of the urinary mercury excretion revealed the following results: 1. Frequency distribution curve of mercury excreted in urine of hourly specimens was best fitted to power function expressed in the form of $y=ax^b$. Adjustment of the urinary mercury concentration by creatinine excretion was shown to be superior($y=1674x^{-1.52},\;r^2=0.95$) over nonadjustment($y=2702x^{-1.57},\;r^2=0.92$) and adjustment by specific gravity of 1.024($y=4535x^{-1.66},\;r^2=0.93$). 2. Both log-transformed mercury excretion in hourly voided specimens and mercury excretion itself in 24 hour specimens showed the normal distributions. 3. The frequency distribution of mercury adjusting the urinary concentration of mercury by creatinine excretion was best fitted to a theoretical normal distribution with the sample means and standard deviation than those unadjusted or adjusted with specific gravity of 1.024. 4. Average urinary mercury excretions in 24-hour urine specimen in an individual were as follows: a) Unadjusted mercury excretion mean and standard deviation : $$18.6{\pm}13.68{\mu}gHg/l$$. median : $$16.0\;{\mu}gHg/l$$. range : $$0.0-55.10\;{\mu}gHg/l$$. b) Adjusted with specific gravity mean : $$20.7{\pm}11.76\;{\mu}gHg/l{\times}\frac{0.024}{S.G-1.000}$$ median : $$20.7\;{\mu}gHg/l{\times}\frac{0.024}{S.G-1.000}$$ range : $$0.0-52.9\;{\mu}gHg/l{\times}\frac{0.024}{S.G-1.000}$$ c) Adjusted with creatinine excretion mean and standard deviation : $$10.5{\pm}6.98\;{\mu}gHg/g$$ creatinine/l median : $$9.4\;{\mu}gHg/g$$ creatinine/l range : $$0.0-26.7\;{\mu}gHg/g$$ creatinine/l 5. No statistically significant differences were found between means calculated from 24-hour urine specimens and those from hourly specimens transformed into logarithmic values. (P<0.05).

  • PDF

Measurement of Quality Parameters of Honey by Reflectance Spectra

  • Park, Chang-Hyun;Yang, Won-Jun;Sohn, Jae-Hyung;Kim, Jong-Hoon
    • 한국근적외분광분석학회:학술대회논문집
    • /
    • 한국근적외분광분석학회 2001년도 NIR-2001
    • /
    • pp.1530-1530
    • /
    • 2001
  • The objectives of this study were to develop models to predict quality parameters of Korean bee-honeys by visible and NIR spectroscopic technique. Two kinds of bee-honey fronl acacia and polyflower sources were tested in this study. The honeys were harvested in the spring of 2000 and stored in the storage facility at 20$^{\circ}C$ during experiments. Total of 394 samples of honey were analyzed. Reflectance spectra, moisture contents, ash, invert sugar, sucrose, F/G (fructose/glucose) ratio, HMF (hydroxymethyl furfural), and C12/C13 ratio of honeys were measured. The average values for the tested honeys were 19.9% of moisture contents, 0.12% of ash, 68.4% of invert sugar, 5.7% of sucrose, 1.27 of F/G(fructose/glucose) ratio, 14.4 mg/kg of HMF, and -19.1 of C12/C13 ratio. A spectrophotometer, equipped with a single-beam scanning monochromator (NIR Systems, Model 6500, USA) and a horizontal setup module, was used to collect reflectance data from honey. The reflectance spectra were measured in wavelength ranges of 400∼2,498 nm. with 2 nm of interval. Thirty-two repetitive scans were averaged, transformed to log(1/Reflectance), and then were stored in a microcomputer file, forming one spectrum per measurement. A sample cell and reflectance plate were made to hold honey samples constantly. Spectra of honey samples were divided into a calibration set and a validation set. The calibration set was used during model development, and the validation set was used to predict quality parameters from unknown spectra. The PLS(Partial Least Square) models were developed to predict the quality parameters of honeys. The first and the second derivatives of raw spectra were also used to develop the models with proper smoothing gap. The MSC (multiplicative scatter correction) and the SNV & Dtr.(standard normal variate and detranding) preprocessing were applied to all spectra to minimize sample-to-sample light scatter differences. The PLS models showed good relationships between predicted and measured quality parameters of honeys in the wavelength range of 1100∼2200 nm. However, the PLS analysis was not good enough to predict HMF of honeys.

  • PDF