Article
LiDAR 정보를 이용한 가상 달 표면 예측
염민기
1
, 정충호
1
, 김명언
2
, 김대관
2
, 이성희
1,*
Estimation of Virtual Moon Surface using LiDAR Measurements
Mingi Yeom
1
, Choongho Chung
1
, Myeungun Kim
2
, Daekwan Kim
2
, Sung-Hee Lee
1,*
1Korea Advanced Institute of Science and Technology (KAIST), Graduate School of Culture Technology
2Korea Aerospace Research Institute (KARI)
*corresponding author: Sung-Hee Lee/ Korea Advanced Institute of Science and Technology (KAIST) (
sunghee.lee@kaist.ac.kr)
© Copyright 2025 Korea Computer Graphics Society. This is an Open-Access article distributed under the terms of the Creative Commons Attribution Non-Commercial License (http://creativecommons.org/licenses/by-nc/4.0/) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.
Received: Nov 06, 2024; Revised: Nov 17, 2024; Accepted: Dec 12, 2024
Published Online: Mar 01, 2025
요약
본 논문에서는 LiDAR 점군 데이터를 입력받아 가상 달 지형의 하이트맵과 노멀맵을 예측하는 MLS(Moon Lidar Simulation) 시스템을 제안한다. MLS 시스템은 먼저 가상 달 지형에서 가상 LiDAR 센서를 시뮬레이션하여 고저차 정보를 샘플링하고, 이를 전처리하여 초기 하이트맵을 생성한다. 이후 Masked Autoencoder (MAE) 기반 네트워크를 활용해 해당 하이트맵을 입력으로 노멀맵을 예측한다. 평가 과정을 통해 음영 지역의 지형을 효과적으로 예측할 수 있음을 확인 하였으며, 예측한 하이트맵과 노멀맵을 Unity 게임 엔진에서 시각화하였다.
Abstract
In this work, we present the MLS (Moon Lidar Simulation) system—a terrain height map and normal map prediction system for virtual lunar landscapes that uses LiDAR point cloud data as input. When operating the MLS system, we first simulate a virtual LiDAR sensor to sample height information from a 3D terrain and preprocess the data to generate an initial height map. We then leverage a Masked Autoencoder (MAE) structure to predict a normal map based on the height map input. Our system demonstrates its capability to predict occluded terrain areas, and we visualize the resulting height map and normal map in the Unity game engine.
Keywords: 라이다; 신경망; 달; 가상 지형
Keywords: LiDAR; Neural Network; Moon; Virtual Terrain
1 서론
본 연구에서는 가상의 3D 달 지형에서 취득한 LiDAR (Light Detection and Ranging) 시뮬레이션 점군 정보를 이용하여 지 형의 하이트맵을 예측하고 노멀맵을 예측하는 Moon LiDAR Simulation (MLS) 시스템을 제안한다.
달 표면 지형 정보는 미래의 달 탐사 지점을 결정하는데 있어 필수적인 정보이다 [1]. 이러한 지형정보는 달 탐사 궤도 위성 (Lunar Reconnaissance Orbiter)[2, 3]을 통해서 취득하거나 이 전의 탐사 정보로부터 습득할 수 있다.
달의 고위도 지점에 위치한 크레이터들은 그 기저부에 영 구적인 음영 지대를 가지고 있으며[4, 5], 이러한 지대의 표면 을 탐지할 때에는 유인 탐사자의 시야 혹은 무인 탐사 차량에 설치된 센서에 의존하여야 한다. 이 때, 추가적인 조명 장비의 도움 없이 RGB 카메라나 시선만으로는 지형지물을 탐지하기 어렵다.
저광량의 환경에서 레이저 거리 측정의 원리를 이용하는 Li-DAR 센서를 활용하면, 지형지물의 굴곡을 직접 측정할 수 있 다. 달 표면은 대부분 암석, 모래, 크레이터로 이루어져 있어, 지구 대비 굴곡 정보의 중요성이 더욱 크다.
기존에 존재하는 달 지형 정보 데이터는 저궤도 인공위성의 삼각측량 값이나 레이저 거리 측정값에 기반한 고저차 정보와 색상 이미지로 이루어져 있다. 그러나 궤도 위성의 센서값을 통 해서 달성한 0.5-2m급 해상도의 지형정보는 저광량 상황에서 지표면에서의 안전한 보행을 보장할 수준의 정보를 제공하기 어렵기 때문에, LiDAR에 기반한 지형 예측 시스템을 학습하는 자료로서의 한계를 가진다.
이러한 문제를 해결하고자, 우리는 가상의 달 지형에서 Li-DAR 시뮬레이션을 구동한 후, 이로부터 습득한 점군 데이터 를 활용하여 지형의 하이트맵과 노멀맵을 예측하는 MLS 시스 템을 제안한다. MLS 시스템은 크게 LiDAR 시뮬레이션부, 달 표면 예측부 두 부분으로 이루어지며, 달 표면 예측부는 하이 트맵 예측 네트워크와 노멀맵 예측 네트워크로 이루어진다.
-
- LiDAR 시뮬레이션부에서는 가상 지형으로부터 점군 데 이터를 샘플링하고 가공하여 하이트맵 이미지를 수집한 다 (Section 3.2, 3.3, 4.1).
-
- 하이트맵 예측 네트워크는 LiDAR 샘플링 과정에서 획득 한 하이트맵의 결손 부분을 예측한다 (Section 4.1).
-
- 노멀맵 예측 네트워크는 하이트맵에 대응하는 노멀맵을 예측하여 지형 굴곡을 증강할 수 있도록 보조한다 (Section 4.2).
우리는 본 논문에서 제안한 MLS 시스템의 달 표면 예측 과 정을 검증한다.
2 관련 연구
2.1 달 표면 데이터
달 표면 지형 정보의 대부분은 달의 궤도에 상주 중인 미국의 달 탐사 궤도 위성(Lunar Reconnaissance Orbiter)를 통해서 취득하며[2, 3], LRO에 장착된 Lunar Orbiter Laser Altimeter (LOLA) 센서로부터 확보한 고저차 정보와 Lunar Reconnaissance Orbiter Camera (LROC)에서 취득한 이미지 정보를 활 용한 Digital Elevation Model (DEM)의 구축이 이루어지고 있다.
LRO 위성은 공전하는 주기 궤도의 고도에 따라서 100m/pixel에서 최대 0.5m/pixel에 해당하는 고저차 이미지 데이터를 수집하여 제공하며, 최근 타 국가의 위성체나 탐사선 을 이용한 표면 데이터 수집 또한 활발히 진행되고 있다[6, 7, 8].
달 탐사 궤도 위성은 50km 이상의 높이에서 공전하기에, 저 해상도의 이미지 정보만을 습득할 수 있다. 따라서, 더욱 고해 상도의 이미지 정보를 확보하기 위해선 달 표면에 근접하여 측정을 수행해야 한다. 이 경우, 무인 차량의 카메라를 이용한 이미지 수집[9]이나 무인 착륙선의 Laser Altimeter를 이용한 소규모 착륙지에 대한 지형 재구축 결과[10]들이 보고되었지 만, 광범위한 달 지형을 측정한 고해상도의 대규모 데이터셋이 공개된 사례는 없다.
2.2 LiDAR 와 레이더를 이용한 지형구성
지구 지형을 측정한 데이터셋은 여러 기관과 회사가 다량으로 구축하여 제공하는데, 주로 차량이나[11, 12] 항공기[13]를 이용 하여 데이터를 수집한다. 이러한 지구 지형 데이터셋은 물체를 탐지하는 알고리즘의 개발에 필요한 데이터 확보, 또는 국토 단위의 DEM 데이터베이스를 구축하기 위해 만들어진다.
지구 DEM 데이터셋은 달과는 상이한 지형과 물체 정보만을 제공하기 때문에 달의 표면과 유사도가 낮다. 먼저, 대부분의 차량 기반 데이터셋은 자율 주행을 위한 환경 정보 수집과 물체 탐지 기능을 가진 네트워크의 개발을 목적으로 수집되기에, 인 공물이 거의 존재하지 않는 달 표면 정보에 대응하기 힘들며, 항공 측량 데이터셋 또한 활발한 대류와 풍화 작용으로 인하여, 달 고유의 소규모 크레이터 지형을 포착하는 경우가 드물다.
2.3 흑백 이미지 색상화 연구
지형의 하이트맵을 이용하여 지형 메쉬를 생성할 때는 노멀맵 을 통해서 세밀한 시각 정보를 제공할 수 있다. 하이트맵 흑백 이미지를 입력받아 노멀맵을 만드는 [14] 연구 외에도, 일반 흑 백 사진 이미지를 채색하는 여러 연구들[15, 16, 17, 18]이 최근 들어 이루어지고 있다. 이 중에서 transformer구조를 접목한 연 구[19]에서는 이미지의 타일화와 위치 인코딩을 통하여, 이미 지의 특정 위치에 대한 어텐션 메커니즘을 접목하였다. 이를 통해서 결손 픽셀이 많은 타일을, 그 근처의 정보에 기반하여 복원하는 과정을 시연하였다.
이러한 Masked Auto Encoder 구조는, 결손부 주변 정보를 통해서 결손부를 복원한다. 지표 위의 장애물로 인해서 지형 탐지 데이터에 결손부가 자주 생기는 LiDAR 측정 시, 위의 구 조를 활용한다면, 결손된 데이터를 효과적으로 예측할 수 있다.
달 표면에서 우주인이나 탐사 차량을 이용한 작업 시, 지형 센서가 탐지하지 못한 결손부의 지형을 복원하는 기능이 안전 상의 이유로 요구되며, 지형의 굴곡 정보를 더욱 증강할 수 있 는 노멀맵 적용을 통해서 지형 파악 효과를 극대화할 필요성 역시 존재한다.
최근의 이미지 채색 연구들에서 소개된 네트워크 구조들은 이러한 동작 조건에 알맞게 대응할 수 있는 잠재성을 보여준다. 우리는 이러한 선행 연구 결과들에 기반하여, LiDAR 입력 정 보로부터 온전한 하이트맵과 그에 대응하는 노멀맵을 예측할 수 있는 시스템을 제안한다.
3. 가상 달 지형 데이터 수집
MLS 시스템은 LiDAR 시뮬레이션 부, 달 표면 예측부로 구 성되어있다. 이 중 시뮬레이션부는 가상 3D 달 지형으로부터 LiDAR 시뮬레이션을 통해 점군 패치 데이터를 수집하고 전처 리하여 하이트맵을 획득한다. 본 Section에서는 시뮬레이션부 내 점군 패치 데이터 수집까지의 내용을 다룬다.
3.1 가상 3D 달 지형
달 지표면의 지형과 노멀맵 정보를 함께 제공하는 고해상도, 대규모 데이터셋이 존재하지 않기 때문에, 우리는 달 표면을 흡사하게 묘사한 가상의 3D 지형 정보에서 LiDAR 시뮬레이 션을 구동하여 지형 정보를 추출한다. 사용한 3D 지형은 이전 의 유인, 혹은 무인 탐사 시 수집된 달 표면 지형 환경과 흡사한 3D 에셋[20]을 사용하였다 (Figure 2).
Figure 2.
Height map (top row) and normal map (bottom row) for the three virtual lunar surface terrains(128m 128m). Example of a virtual lunar surface (terrain 2) visualized w/ only height map (top right) and w/ height map and additional normal map (bottom right).
Download Original Figure
선정된 3D 지형 에셋은 2048픽셀 2048픽셀 크기의 16비트 하이트맵과 노멀맵으로 이루어지는 3가지의 3D 지형으로 구 성되며, 각 변은 128m 128m의 크기에 대응한다. 지형 지표면 데이터 측정을 위해, 가상 LiDAR를 부착한 1.8m 신장의 우주 인 캐릭터[21]를 지형 내에서 보행시키면서 LiDAR 시뮬레이 션을 수행한다.
3.2 가상 LiDAR의 시뮬레이션 세팅
가상 LiDAR는 상용 항공 측정용 LiDAR 기기의 성능을 참조 하여 그 성능 값을 조절한 후, Unity 게임엔진에서 구현한다 (Figure 3). 시뮬레이션 상의 가상 LiDAR는 10Hz의 갱신율을 가지며, 해당 기기가 1.8m 신장의 우주인 모델의 앞머리에 부 착됨을 감안하여 좌우 180°의 수평 시야각을 가지도록 세팅하 였다. 수직 시야각은 하방 50°에서 상방 20°의 범위를 가진다. LiDAR의 해상도는 상용 측량 LiDAR에 준하는 수준인 1.5°의 해상도로 설정한다.
Figure 3.
Vertical field of view (left), detection range (right), and horizontal field of view (right) of virtual LiDAR.
Download Original Figure
LiDAR 센서와 측정점 간의 거리가 멀어질수록 이웃 측정점 간의 거리도 선형적으로 증가하므로, 측정 거리가 멀어질수록 지형 재구축에 적합한 점군 밀도를 확보하기 힘들다. 이러한 한계와 시뮬레이션 상의 성능 최적화를 감안하여 LiDAR 점 군의 입력 범위는 센서로부터 8m 반경의 거리로 제한하였다. 이러한 센서 반경 안에 들어가는 한 변당 8m 크기의 정사각형 이미지를 점군 데이터 패치로 수집한다. 이를 통해서 촘촘하게 샘플링된 데이터를 선별할 수 있다.
3.3 데이터 수집
점군 패치 데이터 수집을 위해서, 3가지의 가상 지형에 대해서 가상 센서를 부착한 우주인 캐릭터를 배치한다. 데이터 수집 시, 우주인이 일반적인 보행 속도로 나선형 경로와 래스터 패 턴을 따라 이동하도록 경로 설정을 하였으며, 10Hz의 측정값 갱신율로 전 지형의 점군 정보를 수집한다.
이때, 갱신 프레임마다 신규로 파악되는 LiDAR 정보만을 저장하는 신규 프레임 정보와 이전의 LiDAR 탐지 정보가 계 속 누적되는 누적 프레임 정보를 같이 수집한다.
마지막으로, 각 LiDAR 점군 프레임이 샘플링된 위치에 대 응하는 원본 하이트맵 패치와 노멀맵 패치를 지형 데이터에서 추출한다. 데이터 모집에는 Intel i9-12600k CPU와 RTX 3080 GPU를 장착한 PC를 이용하였다.
4 달 표면 예측
본 Section에서는 MLS 시뮬레이션부의 전처리 부분부터 MLS 달 표면 예측부까지의 내용을 다룬다. MLS의 달 표면 예측부는 하이트맵 예측 네트워크와 노멀맵 예측 네트워크로 구성된다. 하이트맵 예측 네트워크는 전처리된 LiDAR 누적 프레임 하이 트맵을 받아들이며, 하이트맵의 마스킹 된 결손부를 예측한다.
노멀맵 네트워크는 예측된 하이트맵을 이에 대응하는 노멀맵 으로 변환한다 (Figure 4). 예측된 하이트맵 정보와 노멀맵은 Section 5에서 Unity 게임엔진을 이용하여 시각화한다.
4.1 하이트맵 예측
LiDAR 시뮬레이션으로 얻은 점군 데이터를 네트워크에 사용 하기 위해 높이 스케일링과 결손부 채움 과정을 진행한다. 높이 스케일링은 LiDAR 누적 프레임 패치를 16비트의 높이 단계를 가지는 흑백 하이트맵으로 변환한다. 흑백 하이트맵은 LiDAR 시뮬레이션 과정에서 발생한 결손 픽셀부를 가지고 있다. 결 손부는 주변의 정상 픽셀들의 평균값을 이용하여 채움 전처리 과정을 거치며, 이 과정에서 대부분의 결손 픽셀을 보충하게 된다. 이때, 과도한 결손부 값의 평준화를 피하고자 1픽셀 반 경의 채움 과정을 진행한 후에, 2픽셀 반경, 그리고 마지막으로 3픽셀 반경의 채움 과정을 진행한다. 그런데 지형의 고저차 변 동이 큰 지역에서는 여전히 많은 수의 결손 픽셀이 확인된다.
여전히 결손부가 존재하는 하이트맵은 Masked Auto Encoder (MAE)[19] 구조에 기반한 하이트맵 예측 네트워크를 통 과하여 결손부를 복원하는 과정을 거친다. 하이트맵 예측 네 트워크는 먼저 지형의 하이트맵 이미지를 여러 구획의 패치로 나눈 뒤, 결손 지형 픽셀 비율이 높은 패치를 제외하고 토큰화 한다. 토큰화된 패치를 transformer 인코더의 입력으로 잠재 표현을 계산한다. 입력 마스킹 패치 위치와 대응하도록 잠재 표현에 토큰 패딩을 추가한다. 이후 해당 잠재표현을 입력으로 마스킹된 패치를 예측하고 하이트맵으로 결합한다 (Figure 5). 하이트맵 예측 네트워크는 마스킹된 패치의 원본 패치와 예측 한 패치간의 L2 Norm을 손실로 사용하여 학습한다.
4.2 노멀맵 예측
예측한 하이트맵은 노멀맵 예측 네트워크를 통과하면서 노멀 맵으로 변환되는 도메인 적응 과정을 거친다. 기존에 다른 흑 백 이미지 색상화 연구와 달리 달의 영구 음영 지대에서도 작동 하게 하고자, 노멀맵 예측 네트워크는 사전 색상 정보를 받지 않는다. U-Net구조에 기반한 노멀맵 예측 네트워크는 하이트 맵을 입력받아 동일한 크기의 노멀맵을 출력한다. 학습 시에는 예측한 노멀맵과 참값 노멀맵 간의 L1 Norm을 손실로 사용하 여 학습한다.
5 실험 및 평가
5.1 실험 세부 설정 및 학습
달 표면 예측부 학습 시 강건함을 위하여 LiDAR 시뮬레이션 데이터셋은 평가에만 사용한다. 이를 위해, 하이트맵 학습에는 3가지의 가상 지형(각 2048픽셀 2048픽셀, 혹은 128m 128m 에 해당)으로 부터 학습용 패치(128픽셀 128픽셀, 8m 8m에 해당) 약 42,000개를 추출하여 사용한다. 가상 지형은 LiDAR 시뮬레이션 데이터셋 획득에 사용하지만, 학습 시 LiDAR 시 뮬레이션 결과가 아닌 하이트맵 패치를 분할하여 추출하므로 특정 LiDAR 시뮬레이션 세팅에 제약되지 않는다. 유사하게, 노멀맵 학습에는 하이트맵에 대응하는 노멀맵 3가지(각 2048 픽셀 2048픽셀, 혹은 128m 128m에 해당)로 부터 학습용 패 치(128픽셀 128픽셀, 혹은 8m 8m에 해당)약 42,000개를 추 출하여 사용한다.
하이트맵 예측 네트워크는 적은 데이터셋에서의 과적합을 방지하고 높은 정확도를 유지하기 위해 파인튜닝으로 학습하 며, 패치의 50% 마스킹한다. 또한, 배치 크기를 최대한 크게하 고자 세부 네트워크 각각에 대해 학습한다. 노멀 예측 네트워 크의 경우, 하이트맵 예측 네트워크에 비해 네트워크의 크기가 작아 처음부터 학습을 진행하며, 노멀 예측 네트워크 학습에 하이트맵 예측 네트워크 출력이 아닌 노멀맵 학습용 패치를 사용한다. 학습에는 Intel Xeon Gold 6448Y CPU와 NVIDIA H100 GPU를 장착한 시스템을 이용하였다.
5.2 평가
MLS 달 표면 예측부의 성능 평가를 위해 베이스라인 하이트맵 예측 네트워크와 비교 평가를 진행한다. Table 1과 같이 하이 트맵 예측에 Auto Encoder (AE)를 사용한 베이스라인과 MLS 하이트맵 예측 네트워크를 비교한다. 베이스라인과 MLS 하 이트맵 예측 네트워크의 파라미터 수는 각각 319M와 307M이 다. 하이트맵 예측 네트워크에서 랜덤 마스킹 대신 하이트맵 입력을 패치화하고, 패치의 1/8 이상이 결손되었을시, 해당 패 치를 마스킹한다. 평가용 데이터셋의 총 크기는 1,179개 이며, 그중 464개의 이미지를 이용하여 Figure 6과 같이 패치화를수 행한다.
Table 1:
Height map and normal map prediction results (SSIM)
모델 |
하이트맵 |
노멀맵 |
베이스라인 |
0.981 |
0.734 |
MLS |
0.988 |
0.748 |
Download Excel Table
Figure 6:
Process of masking NaN pixels and their and surrounding area (3-ring) for evaluation (red dotted line)
Download Original Figure
여러 종류의 센서 데이터를 이용한 지형 복원을 수행하는 경 우에는, 입력된 합성 데이터와 모델이 예측한 합성 이미지 간의 통계적인 유사성을 추론하면서 평가를 진행하게 된다[14].본 연구에서는 사용한 데이터셋은 하이트맵, 노멀맵, 그리고 알 베도맵에 대한 참값을 직접적으로 제공하기에 MLS시스템의 산출값과 참값 이미지 패치에 대한 직접적 평가를 수행할 수 있다. 이와 더불어, 크레이터나 굴곡같이 주변부 지형과 연속 적인 연관성을 지니는 곳에서 LiDAR 시뮬레이션의 결손부가 발생하는 경우가 대부분이기에, 이러한 공간적 연관성을 파악 하는데 더욱 용이하다고 알려진 Structural Similarity Index Measure (SSIM) 지표를 사용하여서 생성된 하이트맵과 노멀 맵에 대한 평가를 수행하였다[22].
전체 달 표면에 대해 MLS 하이트맵 예측 네트워크와 노멀맵 예측 네트워크가 베이스라인보다 우수하다 (Table 1). 그런데 직선 광선을 발사하여 물체의 위치와 거리를 파악하는 기술인 LiDAR 특성상 결손부의 경우 굴곡 정보의 가능성이 크며, 안 전한 보행을 보장하기 위해 해당 지형 정보가 필요하다. 평가 용 마스킹 결손부 패치에 대해 비교하여 본 논문에서 목표로 한 결손된 하이트맵 및 대응하는 노멀 예측 정확도를 평가한다.
결손부가 마스킹된 부분의 예측 결과 및 그 주변부와의 연속 성을 보기 위하여, 결손부와 그 주변부(3-ring)를 패치화하여 노멀맵 예측 결과를 비교한다 (Figure 6). 3-ring 패치의 가로와 세로는 최소 11픽셀 이상으로 지정한다. 참값 3-ring 패치와 예 측한 3-ring 패치 간의 비교를 위해 SSIM (Structural Similarity Index Measure)을 평가지표로 사용한다. 결손부에서 MLS 하 이트맵 예측 네트워크와 노멀맵 예측 네트워크가 베이스라인 대비 각각 22.3% 와 25.9% 더 우수하다 (Table 2).
Table 2:
Height map patch and normal map patch prediction results (SSIM)
모델 |
하이트맵 |
노멀맵 |
베이스라인 |
0.707 |
0.343 |
MLS |
0.910 |
0.463 |
Download Excel Table
6 MLS를 활용한 지형 시각화
MLS 시스템의 결과를 가상 지형으로 시각화하는 절차에 대 해서 소개한다. Figure 7과 같이 예측된 하이트맵과 노멀맵을 이용하여 Unity 게임엔진 상에서 지형을 생성하고, 그 위에 노 멀맵을 적용하였다.
Figure 7:
Qualitative evaluation of height map and normal map prediction by baseline method and MLS system.
Download Original Figure
결과물 시각화를 위해 32×32 크기의 독립적인 지형 타일 어 레이 구조를 가지도록 배치하였다. 각 타일은 이미지 패치와 동일한 128픽셀×128픽셀의 크기를 가지며, LiDAR센서를 통 한 지형 업데이트 시 어떠한 시점에서도 4개 이하의 타일만이 업데이트되기에 오버헤드를 최소화한다.
지형 업데이트 시, MLS 달 표면 예측부 결과인 하이트맵 정 보와 노멀맵 정보를 Unity 게임엔진의 지형 타일에 적용하여 시각화한다 (Figure 8). 다만 여기서 나오는 우주인의 경우, 지 형의 크기 가늠을 위해서 모든 예측이 테스트셋에 대해 진행되 어 시각화된 후에 임의로 배치하였다.
Figure 8:
Visualization results using MLS system for terrain 1 (top row), terrain2 (center row), and terrain3 (bottom row)
Download Original Figure
MLS시스템의 경우, Autoencoder를 사용한 베이스라인 네 트워크와 비교해서 LiDAR 결손부 데이터에서 하이트맵과 노 멀맵을 예측할 때, 조금 더 참값과 유사한 결과를 예측함을 확 인하였다.
한편 베이스라인과 MLS 시스템 결과를 시각화할 시, 경계면 아티팩트가 규칙적으로 발생하는 것을 확인하였다. 실험 데이 터 구축을 위해 이미지 패치를 생성할 때, 유니티 어플리케이션 에서는 일정 속도로 이동하는 센서에 대해서 10Hz의 갱신율을 적용하여 이미지를 수집하였고, 그 결과, 공간상 패치간의 거 리가 20-30cm 수준으로 발생하였다. 이러한 패치들에 대해서 연속적으로 예측을 수행하고 시각화를 진행한다면, 지형3을 시각화한 결과의 경우처럼, 예측된 패치가 바로 이전에 예측된 패치와 어느 정도의 색상값 차이를 가질 때, 눈에 띄는 경계면 흔적이 남게 된다.
7 논의
평가 결과에 따르면, 지형 결손부 예측이 선행될 경우, 노멀맵 예측 성능 또한 증가한다. 다만 Table 1, 2와 같이 하이트맵의 SSIM 지표가 노멀맵의 SSIM 값보다 높게 관찰되었다. 노멀맵 예측 네트워크가 노멀맵의 세밀한 지형정보를 예측해야 할 뿐 만 아니라, 하이트맵의 출력에서 생긴 오차를 보정하는 두 개의 기능을 함께 수행해야 하는 한계 때문이다. 이를 해결하기 위 해서는 적합한 잡음을 노멀맵 예측 네트워크의 입력에 넣어서 전처리하는 방식을 시도할 수 있다. 그러나 달 표면 데이터는 기존 MAE 연구에서 다룬 구조화된 객체(사람, 동식물 등)이 아닌 배경(숲, 사막 등)에 대한 데이터가 주가 된다. 그러므로 배경을 크레이터나, 산맥, 평지 등의 지형정보를 의미론적으로 분할하는 작업이 필요하다.
본 논문의 하이트맵 예측 네트워크는 정확도를 높이기 위해 잠재변수를 각 하이트맵 패치와 대응시키는 과정을 사용한다. 패치 단위로 하이트맵 예측을 진행하기 때문에, 한 패치 내에서 결손부의 비율이 일정 수준 이하로 작을 경우에는 해당 부분을 마스킹하지 않는 한계를 보인다. 이를 해결하기 위해, 적응형 크기의 마스킹 패치를 사용하는 하이트맵 예측 네트워크에 대 한 연구가 수행되어야 한다.
마지막으로, 여러 패치가 시간차를 두고 연속적으로 시각화 되는 상황에서는, 연속적으로 예측된 패치들 간의 색상값 차이 로 인해서, 우주인 캐릭터가 일정한 속도로 이동할 경우, 경계면 아티팩트 역시 일정한 간격으로 발생함을 확인하였다. 새로운 센서값을 받아서 신규로 예측되는 패치와 이전에 예측되어서 시각화된 패치 픽셀값 간의 블렌딩 작업을 진행한다면 이러한 경계면 아티팩트의 영향을 최소화할 수 있다.
8 결론
본 연구에서는 LiDAR 지형 시뮬레이션 데이터를 수집하고, 하이트맵 및 노멀맵을 예측하는 MLS 시스템을 제안하였다. MAE구조에 기반한 하이트맵 예측 네트워크를 활용하여 Li-DAR의 점군 데이터로부터 지형의 하이트맵을 예측하였고, 노 멀맵 예측 네트워크를 통해 하이트맵을 다시 노멀맵으로 변환 하였다. 이러한 과정을 통해 사실적이면서도 정확한 지형 정보 를 예측하였다. 이를 활용하면, 달에서 보행 안전도를 높일 수 있다.
본 시스템은 저광량의 조건에서도, 가상 달 표면 지형 정보 를 예측할 수 있으므로, 미래의 무인 혹은 유인 탐사 시 지형 매 핑에 적용할 수 있다. 또한, 어떠한 지형 합성 LiDAR 정보에도 적용할 수 있기에, 저궤도 위성 정보, 항공 LiDAR, SAR 이미지 등의 지형개구센서 데이터셋을 이용한 지형 예측에도 활용될 수 있다.
Figure 10:
Normal map prediction network (left) and residual dense block (RDB) detail (right) <- 노멀 예측 네트워크(좌)와 RDB(Residual Dense Block) 세부 구조(우)
Download Original Figure
감사의 글
이 논문은 한국항공우주연구원에서 지원을 받아 수행된 연 구 결과입니다 (L20240731-00). 이 논문은 과학기술정보통신 부·광주광역시가 공동 지원한 ’인공지능 중심 산업융합 집적 단지 조성사업’으로 지원받아 수행된 연구 결과입니다. 이 논 문은 2024년 대한민국 교육부와 한국연구재단의 지원을 받아 수행된 연구임 (RS-2024-00454458).
References
D. De Rosa, B. Bussey, J. T. Cahill, T. Lutz, I. A. Crawford, T. Hackwill, S. van Gasselt, G. Neukum, L. Witte, A. McGovern, et al., “Characterisation of potential landing sites for the european space agency’s lunar lander project,” Planetary and space science, vol. 74, no. 1, pp. 224–246, 2012.

G. Chin, S. Brylow, M. Foote, J. Garvin, J. Kasper, J. Keller, M. Litvak, I. Mitrofanov, D. Paige, K. Raney, et al., “Lunar reconnaissance orbiter overview: Theáinstrument suite and mission,” Space Science Reviews, vol. 129, pp. 391–419, 2007.

R. Vondrak, J. Keller, G. Chin, and J. Garvin, “Lunar reconnaissance orbiter (lro): Observations for lunar exploration and science,” Space science reviews, vol. 150, pp. 7–22, 2010.

D. Bussey and P. Spudis, “The lunar polar illumination environment: What we know & what we don’ t,” Space Resources Roundtable VI, vol. 6022, 2004.
P. G. Lucey, P. O. Hayne, E. Costello, R. Green, C. Hibbitts, A. Goldberg, E. Mazarico, S. Li, and C. Honniball, “The spectral radiance of indirectly illuminated surfaces in regions of permanent shadow on the moon,” Acta Astronautica, vol. 180, pp. 25–34, 2021.

C. Li, J. Liu, X. Ren, L. Mou, Y. Zou, H. Zhang, C. Lü, J. Liu, W. Zuo, Y. Su, et al., “The global image of the moon obtained by the chang’e-1: Data processing and lunar cartography,” Science China Earth Sciences, vol. 53, pp. 1091–1102, 2010.

A. Basilevsky, A. Abdrakhimov, J. Head, C. Pieters, Y. Wu, and L. Xiao, “Geologic characteristics of the luna 17/lunokhod 1 and chang’e-3/yutu landing sites, northwest mare imbrium of the moon,” Planetary and Space Science, vol. 117, pp. 385–400, 2015.

Y.-J. Song, J. Bae, S. Hong, J. Bang, K. M. Pohlkamp, and S. Fuller, “Kari and nasa jsc collaborative endeavors for joint korea pathfinder lunar orbiter flight dynamics operations: architecture, challenges, successes, and lessons learned,” Aerospace, vol. 10, no. 8, p. 664, 2023.

B. Wu, Y. Li, W. C. Liu, Y. Wang, F. Li, Y. Zhao, and H. Zhang, “Centimeter-resolution topographic modeling and fine-scale analysis of craters and rocks at the chang’e-4 landing site,” Earth and Planetary Science Letters, vol. 553, p. 116666, 2021.

B. Wu, F. Li, L. Ye, S. Qiao, J. Huang, X. Wu, and H. Zhang, “Topographic modeling and analysis of the landing site of chang’e-3 on the moon,” Earth and Planetary Science Letters, vol. 405, pp. 257–273, 2014.

A. Geiger, P. Lenz, and R. Urtasun, “Are we ready for autonomous driving? the kitti vision benchmark suite,” in 2012 IEEE conference on computer vision and pattern recognition. IEEE, 2012, pp. 3354–3361.

H. Caesar, V. Bankiti, A. H. Lang, S. Vora, V. E. Liong, Q. Xu, A. Krishnan, Y. Pan, G. Baldan, and O. Beijbom, “nuscenes: A multimodal dataset for autonomous driving,” in Proceedings of the IEEE/CVF conference on computer vision and pattern recognition, 2020, pp. 11 621–11 631.

NOAA Office for Coastal Management, U.S. Geological Survey, Federal Emergency Management Agency, and U.S. Interagency Elevation Inventory Partners, “U.S. Interagency Elevation Inventory,”
https://coast.noaa.gov/inventory, 2023, accessed: 2024-10-25.
C.-J. Liu, V. A. Krylov, P. Kane, G. Kavanagh, and R. Dahyot, “Im2elevation: Building height estimation from single-view aerial imagery,” remote sensing, vol. 12, no. 17, p. 2719, 2020.

R. Zhang, P. Isola, and A. A. Efros, “Colorful image colorization,” in Computer Vision–ECCV 2016: 14th European Conference, Amsterdam, The Netherlands, October 11-14, 2016, Proceedings, Part III 14. Springer, 2016, pp. 649–666.

R. Zhang, J.-Y. Zhu, P. Isola, X. Geng, A. S. Lin, T. Yu, and A. A. Efros, “Real-time user-guided image colorization with learned deep priors,” arXiv preprint arXiv:1705.02999, 2017.

Z. Zhu, Z. Xu, A. You, and X. Bai, “Semantically multi-modal image synthesis,” in Proceedings of the IEEE/CVF conference on computer vision and pattern recognition, 2020, pp. 5467–5476.
Z. Xu, T. Wang, F. Fang, Y. Sheng, and G. Zhang, “Stylization-based architecture for fast deep exemplar colorization,” in Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, 2020, pp. 9363–9372.
K. He, X. Chen, S. Xie, Y. Li, P. Dollár, and R. Girshick, “Masked autoencoders are scalable vision learners,” in Proceedings of the IEEE/CVF conference on computer vision and pattern recognition, 2022, pp. 16 000–16 009.
I. Žeger, N. Bilanović, G. Šišul, and S. Grgić, “Comparison of metrics for colorized image quality evaluation,” in 2022 International Symposium ELMAR. IEEE, 2022, pp. 209–214.

W. Cao, Z. Cai, and Z. Tang, “Fractal structure of lunar topography: An interpretation of topographic characteristics,” Geomorphology, vol. 238, pp. 112–118, 2015.

A. Vashishtha and S. Kumar, “Characterization of geomorphological features of lunar surface using chandrayaan-1 mini-sar and lro mini-rf data,” Quaternary International, vol. 575, pp. 338–357, 2021.

E. Mazarico, G. Neumann, D. Smith, M. Zuber, and M. Torrence, “Illumination conditions of the lunar polar regions using lola topography,” Icarus, vol. 211, no. 2, pp. 1066–1081, 2011.

A. H. Lang, S. Vora, H. Caesar, L. Zhou, J. Yang, and O. Beijbom, “Pointpillars: Fast encoders for object detection from point clouds,” in Proceedings of the IEEE/CVF conference on computer vision and pattern recognition, 2019, pp. 12 697–12 705.
X. Li, W. Yu, S. Wang, S. Li, H. Tang, Y. Li, Y. Zheng, K. T. Tsang, and Z. Ouyang, “Condition of solar radiation on the moon,” Moon: Prospective Energy and Material Resources, pp. 347–365, 2012.

G.-S. Xia, X. Bai, J. Ding, Z. Zhu, S. Wang, S. Belongie, J. Luo, M. Datcu, M. Pelillo, and L. Zhang, “Dota: A large-scale dataset for object detection in aerial images,” in Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 2018, pp. 3974–3983.
Appendices
부록
A 네트워크 구조
본 장에서는 베이스라인과 MLS 달 표면 예측부의 네트워크 구조에 대해 설명한다. Figure 10에서 conv는 합성곱 레이어 와 ReLU 활성화 함수 레이어 쌍을 의미하며 마지막 합성곱레 이어의 경우(conv(64, 6, 1, 1)) ReLU 활성화 함수를 사용하지 않는다. 합성곱 레이어의 각 인자는 순서대로 (출력 채널 크기, 커널 크기, 필터 이동 폭, 패딩, 팽창 비율)을 뜻한다. 팽창 합성 곱을 사용하지 않은 경우 팽창 비율을 제외하고 표현한다.
⊙ 으로 묶인 conv의 경우 2개 이상의 conv를 한 블록에 한꺼 번에 표현하였으며, 해당 블록 마지막에는 항상 배치 정규화가 포함된다. ⊕는 레이어 출력 피처를 이어 붙이는 것을 나타낸다.
A.1 베이스라인 네트워크 구조
베이스라인의 AE의 구조는 Figure 10에서 모든 레이어의 채 널을 2배로 증가시켜 학습하며, 마지막 레이어(conv(64, 6, 1, 1))대신 conv(32, 1, 1)과 conv(3, 1, 1)을 추가하여 단일 채널을 출력한다. 노멀맵 예측 네트워크의 구조는 Figure 10과 동일 하다.
A.2 MLS 달 표면 예측부 구조
MLS 달 표면 예측부는 하이트맵 예측 네트워크와 노멀맵 예 측 네트워크로 구성된다. 하이트맵 예측 네트워크의 구조는 Figure 9와 동일하며, 노멀맵 예측 네트워크의 구조는 Figure 10과 동일하다. Figure 9에서 conv에는 합성곱 레이어만 속해 있다. 또한 인코더와 디코더에서 사용한 트랜스포머 블록의 각 인자는 순서대로 (입력 토큰 임베팅 차원, 다중 헤드 셀프 어텐 션 헤드 수, MLP 레이어에서 확장되는 비율)을 의미하며 인코 더는 16개의 블록으로 이루어져 있고 디코더는 8개의 블록으로 이루어져있다.
하이트맵 예측 네트워크는 인코더와 디코더를 수행하기 전 포지셔널 인코딩을 수행한다. 입력 이미지에 대하여 합성곱을 수행한 뒤 마스킹한 패치 피처를 제외하고 나머지에 대하여 인 코딩을 진행한다. 인코딩을 진행한 이후 디코딩 이전에 마스킹 토큰을 추가하여 마스킹한 패치 피처를 예측한다. 이 과정에서 하이트맵 네트워크에서 CLS 토큰은 실제로 이미지 패치화는 되지 않지만, 패치들의 전반적인 정보를 인코더부터 디코더까 지 전달하는 역할을 수행한다.
< 저 자 소 개 >
염 민 기
-
2018년 2월 중앙대학교 융합공학부 디지털이미징 전공 졸업 (학사)
-
2020년 8월 KAIST 문화기술대학원 졸업 (석사)
-
2020년 9월~현재 KAIST 문화기술대학원 박사과정 재학
-
관심분야: 의복 모델링, 인체 모델링, 거대언어모델, 인공지능
정 충 호
-
2014년 2월 KAIST 기계공학과 졸업 (학사)
-
2016년 2월 KAIST 기계공학과 졸업 (석사)
-
2018년 8월 KAIST 문화기술대학원 졸업 (석사)
-
2018년 9월~현재 KAIST 문화기술대학원 박사과정 재학
-
관심분야: 텔레프레즌스, 인공지능, 캐릭터 애니메이션, 거대언어모델
김 명 언
-
2015년 2월 울산과학기술원 컴퓨터공학과 졸업 (학사)
-
2020년 8월 울산과학기술원 전기전자공학과 졸업 (박사)
-
2020년 7월~현재 한국항공우주연구원 선임연구원
-
관심분야 : AI/딥러닝, 항공우주, AR/VR
김 대 관
-
2001년 2월 한국항공대학교 항공기계공학과 졸업 (학사)
-
2003년 8월 한국과학기술원 항공우주공학 (석사)
-
2008년 2월 한국과학기술원 항공우주공학 (박사)
-
2007년 12월~현재 한국항공우주연구원 책임연구원
-
관심분야 : 항공우주, 기계공학, 진동공학, 위성설계, 위성제어
이 성 희
-
1996년 서울대학교 기계공학과 졸업 (학사)
-
2000년 서울대학교 기계공학과 졸업 (석사)
-
2008년 University of California, Los Angeles(UCLA) 졸업(박사)
-
2010년~2013년 광주과학기술원(GIST) 조교수
-
2013년 7월~2024년 12월 KAIST 조교수, 부교수, 교수
-
관심분야: 디지털 휴먼 모델링, 디지털 휴먼 동작 생성, 텔레프레즌스 아바타