• Title/Summary/Keyword: 위치인코딩

Search Result 40, Processing Time 0.022 seconds

A Study on Traffic Accident Detection by Semantic Representation (의미적 표현을 통한 교통사고 검출에 관한 연구)

  • Renjie Jin;Yunsick Sung
    • Annual Conference of KIPS
    • /
    • 2023.05a
    • /
    • pp.507-509
    • /
    • 2023
  • 최근 딥러닝은 도로 CCTV 동영상의 교통사고 검출에 널리 사용되지만 일인칭 동영상의 교통사고 검출은 분명히 어렵다. 일인칭 동영상은 역동적이고 시야가 제한되어 있기 때문이다. 본 논문에서는 일인칭 동영상을 분석하여 교통사고를 검출하는 방법을 제시한다. 이 방법은 교통 표현 특성을 분석하는 것 외에도 의미를 이해하고 교통 장면을 인코딩한다. 프레임의 표현 특징은 각 프레임 상의 물체의 특징과 물체의 위치 관계의 공간적 숨겨진 특진을 학습함으로써 얻어진다. 그 후에 프레임 표현 특징과 교통 장면의 특징이 연결되어 GRU 실행기에 공급된다. 여러 GRU 실행기는 분석한 후 사고가 발생했는지 확인된다. 이 방법은 높은 역학과 제한된 시야 문제를 효과적으로 해결한다.

Design and Implementation of Dynamic Streaming Server based on RTSP (RTSP 기반의 동적 스트리밍 서버의 설계 및 구현)

  • Yeon, Jae-Hyuk;Lim, Hyo-Taek;Park, Jae-Hong
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2010.10a
    • /
    • pp.407-410
    • /
    • 2010
  • This paper is to implement a RTSP based streaming server in order to provide streaming service. When a client requests a stream from a server, transmission speed is measured on a regular basis through communications between the client and the server. Server will send different encoded movie clip streams based on measured transmission speeds. Different streams are sent to a server depending on the transmission speed and their locations are saved when streams are sent. Even though different streams are sent, the streams will be sent without any interruptions because they are sent from their original locations.

  • PDF

A statistical journey to DNN, the third trip: Language model and transformer (심층신경망으로 가는 통계 여행, 세 번째 여행: 언어모형과 트랜스포머)

  • Yu Jin Kim;In Jun Hwang;Kisuk Jang;Yoon Dong Lee
    • The Korean Journal of Applied Statistics
    • /
    • v.37 no.5
    • /
    • pp.567-582
    • /
    • 2024
  • Over the past decade, the remarkable advancements in deep neural networks have paralleled the development and evolution of language models. Initially, language models were developed in the form of Encoder-Decoder models using early RNNs. However, with the introduction of Attention in 2015 and the emergence of the Transformer in 2017, the field saw revolutionary growth. This study briefly reviews the development process of language models and examines in detail the working mechanism and technical elements of the Transformer. Additionally, it explores statistical models and methodologies related to language models and the Transformer.

A Study of Visualization Scheme of Sensing Data Based Location on Maps (지도에서 위치 기반의 센싱 데이터 가시화 방안 연구)

  • Choi, Ik-Jun;Kim, Yong-Woo;Lee, Chang-Young;Kim, Do-Hyeun
    • The Journal of the Institute of Internet, Broadcasting and Communication
    • /
    • v.8 no.5
    • /
    • pp.57-63
    • /
    • 2008
  • Recently, OGC(Open Geospatial Consortium) take the lead in SWE(Sensor Web Enablement) research that collection various context information from sensor networks and show it on map by web. OGC SWE WG(Working Group) defines a standard encoding about realtime spatiotemporal appear geographical feature, sensing data and support web services. This paper proposes a visualization scheme of sensing data based location on 2D maps. We show realtime sensing data on moving node that mapping GPS data on map. First, we present an algorithm and procedure that location information change to position of maps for visualization sensing data based on 2D maps. For verifying that algorithm and scheme, we design and implement a program that collecting GPS data and sensing data, and displaying application on 2D maps. Therefore we confirm effective visualization on maps based on web which realtime image and sensing data collected from sensor network.

  • PDF

Geocoding Scheme for Multimedia in Indoor Space Based on IndoorGML (IndoorGML을 활용한 실내공간 멀티미디어 위치 인코딩 방법)

  • Li, Ki Joune
    • Spatial Information Research
    • /
    • v.21 no.4
    • /
    • pp.35-45
    • /
    • 2013
  • Most multimedia contains location information whether they are implicit or explicitly, and which are very useful for several purposes. In particular, we may use location information in defining query conditions to retrieve relevant multimedia. For this reason, a number of works have been done to organize and retrieve geo-referenced multimedia data. However, they mostly focus on outdoor space where position is identified by (x, y, z) coordinates. In this paper, we focus on multimedia in an alternative space, indoor space, which differs from outdoor space in several aspects. First indoor space is considered as symbolic space, where location is identified by a symbolic code such as room number rather than coordinates. Second, topological information is a crucial element in providing indoor spatial information services. Third, indoor space is in more micro-scale than outdoor space, which influences on determining the visibility of cameras. Based on these different characteristics of indoor space, we survey the requirements of management systems of indoor geo-referenced multimedia. Then we propose a geo-coding scheme for multimedia in indoor space as an extension of IndoorGML, an OGC(Open Geospatial Consortium) candidate standard for indoor spatial information. We also present a prototype system called, IngC (INdoor Geo-Coding) developed to store and manage indoor geo-referenced multimedia.

The Efficient Error Resilient Entropy Coding for Robust Transmission of Compressed Images (압축 영상의 강건한 전송을 위한 효과적인 에러 내성 엔트로피 부호화)

  • Cho, Seong-Hwan;Kim, Eung-Sung;Kim, Jeong-Sig
    • Journal of the Korea Academia-Industrial cooperation Society
    • /
    • v.7 no.2
    • /
    • pp.206-212
    • /
    • 2006
  • Many image and video compression algorithms work by splitting the input image into blocks and producing variable-length coded bits for each block data. If variable-length coded data are transmitted consecutively, then the resulting coder is highly sensitive to channel errors. Therefore, most image and video techniques for providing some protection to the stream against channel errors usually involve adding a controlled amount of redundancy back into the stream. Such redundancy might take the form of resynchronization markers, which enable the decoder to restart the decoding process from the known state, in the event of transmission errors. The Error Resilient Entropy Code (EREC) is a well known method which can regain synchronization without any redundant information to convert from variable-length code to fixed-length code. This paper proposes an enhancement to EREC, which greatly improves its transmission ability for the compressed image quality without any redundant bits in the event of errors. The simulation result shows that the both objective and subjective quality of transmitted image is enhanced compared with the existing EREC at the same BER(Bit Error Rate).

  • PDF

Semantic Segmentation of Drone Images Based on Combined Segmentation Network Using Multiple Open Datasets (개방형 다중 데이터셋을 활용한 Combined Segmentation Network 기반 드론 영상의 의미론적 분할)

  • Ahram Song
    • Korean Journal of Remote Sensing
    • /
    • v.39 no.5_3
    • /
    • pp.967-978
    • /
    • 2023
  • This study proposed and validated a combined segmentation network (CSN) designed to effectively train on multiple drone image datasets and enhance the accuracy of semantic segmentation. CSN shares the entire encoding domain to accommodate the diversity of three drone datasets, while the decoding domains are trained independently. During training, the segmentation accuracy of CSN was lower compared to U-Net and the pyramid scene parsing network (PSPNet) on single datasets because it considers loss values for all dataset simultaneously. However, when applied to domestic autonomous drone images, CSN demonstrated the ability to classify pixels into appropriate classes without requiring additional training, outperforming PSPNet. This research suggests that CSN can serve as a valuable tool for effectively training on diverse drone image datasets and improving object recognition accuracy in new regions.

Comparing State Representation Techniques for Reinforcement Learning in Autonomous Driving (자율주행 차량 시뮬레이션에서의 강화학습을 위한 상태표현 성능 비교)

  • Jihwan Ahn;Taesoo Kwon
    • Journal of the Korea Computer Graphics Society
    • /
    • v.30 no.3
    • /
    • pp.109-123
    • /
    • 2024
  • Research into vision-based end-to-end autonomous driving systems utilizing deep learning and reinforcement learning has been steadily increasing. These systems typically encode continuous and high-dimensional vehicle states, such as location, velocity, orientation, and sensor data, into latent features, which are then decoded into a vehicular control policy. The complexity of urban driving environments necessitates the use of state representation learning through networks like Variational Autoencoders (VAEs) or Convolutional Neural Networks (CNNs). This paper analyzes the impact of different image state encoding methods on reinforcement learning performance in autonomous driving. Experiments were conducted in the CARLA simulator using RGB images and semantically segmented images captured by the vehicle's front camera. These images were encoded using VAE and Vision Transformer (ViT) networks. The study examines how these networks influence the agents' learning outcomes and experimentally demonstrates the role of each state representation technique in enhancing the learning efficiency and decision- making capabilities of autonomous driving systems.

Design of Geocoder service for LBS in Wireless telecommunication environment (무선통신 환경에서의 LBS를 위한 지오코더 서비스 설계)

  • Han, Eun-Young;Choi, Hae-Ock
    • 한국공간정보시스템학회:학술대회논문집
    • /
    • 2003.11a
    • /
    • pp.118-122
    • /
    • 2003
  • 본 논문은 무선통신 환경에서 다양한 위치정보의 응용서비스인 위치기반서비스의 공통적인 기능을 가지는 지오코더 서비스를 설계하는 것이다. 위치기반서비스는 망이나 GPS 등의 측위기술을 이용하여 휴대 단말 등 사용자의 위치정보를 제공하는 것으로 최근 부가가치가 기대되는 서비스이다. 지오코더 서비스는 주소 등의 요청에 대해 X, Y, Z 등으로 표현되는 지리적 위치정보를 제공하는 서비스와 역으로 지리적 위치정보를 포함하는 요청에 대해 주소 등을 포함한 정규화 된 정보를 제공하는 역지오코더 서비스로 정의할 수 있다. 국내의 많은 웹 기반의 GIS 서비스들이 지형지물 등에 의해 지리적인 위치를 탐색하는 지오코딩 기능이 구현되어 있으나, 지리 정보에 대한 각각 서로 다른 인터페이스들이 사용되고 있어, 확장된 활용성에 한계를 가지고 있다. 특히, 무선통신 환경의 발전에 따른 효율적인 지리적 위치정보의 활용을 통한 다양한 위치기반서비스의 개발 및 활성화를 위하여 국제동향을 고려한 정규화 된 지오코더 서비스의 개발이 요구된다. 본 논문에서는 지리적 위치정보를 포함하고 있는 지오코더 서비스를 위하여 기술규격 범위와 요구기능 정의, 서비스를 위한 데이터의 정규화 및 인터페이스를 설계하여, 국내 무선통신 환경에서 다양한 위치기반서비스의 활용성을 높이기 위한 서비스 시스템 방안을 마련하고자 한다. 또한, 주소 정의에 있어서 국내 주소체계를 충분히 분석하여 구축하였다. 이는 본 연구자가 LBS 표준화 포럼을 통하여 작성 중인 '지오코더서비스 인터페이스 기술규격'을 수용한 것이다.적으로 분석하고, 지형정보의 체계적 관리를 위해 가장 필요한 해안습지 지형분류도를 작성하기 위해 가장 기초적인 단계인 해안습지 지형분류체계에 대한 국내외의 연구성과를 비교하여 시안을 작성 표준화를 위한 첫 단계 시도를 소개하였다.분석 결과는 문장, 그림 및 도표, 장 끝의 질문, 학생의 학습 활동 수 등이 $0.4{\sim}1.5$ 사이의 값으로 학생 참여를 적절히 유도하는 발견 지향적 인 것으로 조사되었다. 그러나 장의 요약은 본문 내용을 반복하는 내용으로 구성되었다. 이와 같이 공통과학 과목은 새로운 현대 사회에 부응하는 교과 목표와 체계를 지향하고 있지만 아직도 통합과학으로서의 내용과 체계를 완전히 갖추고 있지 못할 뿐만 아니라 현재 사용되고 있는 7종의 교과서가 교육 목표를 충분히 반영하지 못하고 있다. 따라서 교사의 역할이 더욱더 중요하게 되었다.괴리가 작아진다. 이 결과에 따르면 위탁증거금의 징수는 그 제도의 취지에 부합되고 있다. 다만 제도운용상의 이유이거나 혹은 우리나라 주식시장의 투자자들이 비합리적인 투자형태를 보임에 따라 그 정책적 효과는 때로 역기능적인 결과로 초래하였다. 그럼에도 불구하고 이 연구결과를 통하여 최소한 주식시장(株式市場)에서 위탁증거금제도는 그 제도적 의의가 여전히 있다는 사실이 확인되었다. 또한 우리나라 주식시장에서 통상 과열투기 행위가 빈번히 일어나 주식시장을 교란시킴으로써 건전한 투자풍토조성에 저해된다는 저간의 우려가 매우 커왔으나 표본 기간동안에 대하여 실증분석을 한 결과 주식시장 전체적으로 볼 때 주가변

  • PDF

Bookmark for Multimedia Content Having Multiple Variations (변형을 갖는 멀티미디어 콘텐트에 대한 북마크)

  • Yeom, Ji-Hyeon;Kim, Myoung-Hoon;Sull, Sang-Hoon;Kim, Hyeok-Man
    • Journal of KIISE:Computing Practices and Letters
    • /
    • v.15 no.7
    • /
    • pp.489-494
    • /
    • 2009
  • Since multimedia content is often independently encoded into multiple variations having diverse bandwidths, resolutions and compression formats, the same segment might be stored at different temporal positions within the variations. In this paper, we present a durable multimedia bookmark mechanism which provides a convenient way of switching to any variation before or during playback of the multimedia content, without experiencing temporal discontinuity or overlapping a portion of the content. We also present a new multimedia bookmark player with which users can manage a personal collection of bookmarks with an intuitive visual interface.