1. 서론
다양한 변수를 가진 대규모 데이터를 분석하고 처리하는 과제들 이 지속적으로 늘어나는 요즘, 시각화 분야에서는 최신 기술을 활용하여 데이터를 의미적으로 표현하고 통찰력을 얻기 위한 노 력이 지속되고 있다 [1]. 특히, 확장현실(eXtended Reality) 기반 데이터 시각화는 스마트디바이스 및 컴퓨터 비전 기술의 발전으 로 인해 더욱 정교하고 몰입감 있는 시각화 경험을 제공한다 [2]. 또한, 다수의 참여자들이 초차원 공간(hyper-dimension space) 속 시각화를 효과적으로 인터랙션하는 과정에서 기존의 2차원 공간 한계로 인해 해석의 불편함이 있었던 시각화 분석을 가능하게 만 든다 [3].
확장현실을 기반으로 한 데이터 시각화 연구는 오브젝트를 효 과적으로 배치시키기 위한 공간 디자인 연구 [4], 시각화의 원활 한 인터랙션을 위한 다중 감각 활용 기반 몰입형 분석 시스템 연 구 [5, 6]를 중심으로 진행되고 있었으며 그 결과 IATK [7], DxR toolkit [8], Gadget Arms 형태의 제스처 기반 [9] 및 포털(portal) 이동형 [10] 데이터 시각화 시스템, FIESTA [11] 등의 연구들이 등장하게 되었다.
그러나 해당 연구들은 물리적으로 같은 공간 안에서 인터랙션 이 이루어진다는 점, 시각화 분석 및 편집을 위해서는 PC를 통해 서 이루어지고 몰입형 미디어 디바이스로는 주로 모니터링 이루 어진다는 점이 있다. 그리고 특수한 미디어 장비를 갖추어 분석이 진행되기 때문에 행동의 제약이나 불편함이 있다.
기존 연구들의 특징을 살펴봤을 때, 1) 시각화를 보다 편리하게 조작하는 방안을 마련하고 2) 이기종 디바이스 간 협업을 지원하 는 확장현실 기반 데이터 시각화 시스템의 마련은 현재의 연구 흐름에서도 반드시 필요하다.
본 연구는 PC 사용자 및 VR 디바이스 사용자들이 시간과 장 소에 구애받지 않고 리모트 형식으로 확장현실 기반의 데이터 시 각화를 인터랙션할 수 있는 시스템을 소개한다 (연구 프로세스는 Figure 1 참고). 해당 시스템에서는 모든 디바이스의 사용자들이 손쉽게 시각화를 제어할 수 있는 노드-링크 다이어그램 기반의 분석 인터페이스를 제공한다.
또한, 여러 변수를 가진 데이터를 시각화하기에 적합하도록 Bar Chart, Scatterplot, Parallel Coordinate [11] 시각화 테크닉을 제공한다. 특히 기존의 확장 현실 기반 시각화 툴킷(toolkit)에서 다루는 Parallel Coordinate는 오브젝트 개수 제한 등으로 인해 상 호작용이 자유롭지 않은 한계가 있었으나 [7], 본 연구의 Parallel Coordinate는 오브젝트 개수의 제한 문제를 대폭 완화하고 비쥬 얼 클러터(visual clutter)를 줄이며, 분석 인터랙션이 용이하도록 개선하였다.
이밖에도 이기종 디바이스를 이용하는 사용자들이 초차원적 가상 공간에서 만나 시각화를 생성하고 분석을 진행한 뒤, 분석 된 작업물을 저장하고 공유할 수 있는 기능을 제공한다. 해당 기 능은 리모트 기반 환경에서 사용자 간의 효과적인 인터랙션을 가능하게 하고 분석 작업의 능률을 높일 수 있는 장점이 있다.
본 연구는 시스템에서 진행되는 협업 분석 방법을 예시를 들 어 설명하기 위해 시나리오를 설계하였다. 또한, 사용성 검증을 위해 시나리오에 기반한 파일럿 실험을 진행하였다. 이 실험을 통해 모든 사용자가 시각적 분석을 진행하는 데 있어서 신속하고 효율적인 편집이 가능하고, 본 연구의 시스템은 네트워크 환경 속 에서 데이터 협업 분석에 대한 원활한 소통과 이해를 돕는 것을 확인하였다.
2. 관련 연구 고찰
물리적인 제약을 받지 않는 확장 현실 공간에서 데이터 시각화 오 브젝트를 매핑(mapping)하고 인터랙션하기 위한 다양한 연구가 존재한다. 우선, ImAxes [12]는 가상현실(VR) 환경에서 데이터 의 로드 및 장면의 전환이 없이 사용자가 직접 정규 문법(formal grammar: 축의 개수 및 조립의 방식에 따라 서로 다른 시각화 테 크닉이 구현됨)을 토대로 시각화를 생성한다는 점에서 인터랙션 의 방식이 개선되었다. 그렇지만 너무 많은 시각화 오브젝트를 생성하게 되면 급격한 성능 저하가 발생하거나, 분석 도중 이전에 작업하던 데이터 인스턴스가 일시적으로 사라지는 현상이 나타 난다. 또한, 다량의 변수를 대상으로 시각화를 진행하는 Parallel Coordinate는 특정 축을 중심으로 필터링 기능을 실행했을 때 인 접한 축에 대해서만 필터링이 반영되고 이외 다른 축에는 필터링 작업이 반영되지 않는 문제가 발생한다.
ImAxes의 후속 작업인 IATK [7]에서는 더 많은 종류의 시각화 를 조합하여 분석하는 수준으로 툴킷이 발전되었다. 그리고 Be The Data [13] 에서는 VR 환경에서 다차원 데이터 시각화를매 핑한 뒤, 사용자가 카메라의 관점을 데이터 인스턴스의 위치로 자유롭게 이동시킬 수 있는 기능을 제공하여 데이터 분석의자 유도를 높였다. 그러나 두 연구 모두 시각화의 변형을 위해서는 Unity 상의 인스펙터(inspector) 창에서 직접 구체적인 수치 조정 을 진행해야하는 불편함이 있다. 이는 곧 PC의 제어 하에 VR 디 바이스가 분석을 할 수 있는 구조이기 때문에 사용자들은 게임 엔진의 조작 과정을 거쳐야하므로 사용 난이도가 올라갈 수 있다.
이후에는 사용자가 고자유도 환경 속에서 데이터 시각화를 직접 분석하고 변형하는 연구들이 진행되었다. 우선 Gadget Arms [9] 시스템은 Microsoft HoloLens 및 Leap Motion 손 추 적 센서를 이용해 시각화 파라미터의 메뉴를 제어하고 DxR toolkit [8]의 시각화 오브젝트를 변형, 회전, 배치할 수 있는 기 능을 제공했다. 최근에는 가상현실에서 원거리 객체를 정확하 게 상호작용하기 위해 Extended Hand 및 Portal기술 [10]을 융 합하여 원거리 가상 객체를 제어하는 방식이 연구되었다. 또한, iARVis [14]는 모바일 AR 기반 정보 시각화 환경에서 데이터를 자동 배치하고 이미지, 차트 등을 함께 제공하여 데이터의 이해 를 도왔다. 이상의 방식들은 VR 환경에 적합한 인터랙션 방안을 소개하고 있으며 시각화 객체들을 직접 접촉하는 방식을 택한다 는 특징이 있다. 따라서 앞으로는 XR 디바이스와 비XR 디바이스 (PC, 모바일) 모두에서 조작이 용이한 인터페이스를 가지고 리모 트 형식으로 데이터 시각화를 자유롭게 분석하는 방식의 연구가 진행되는 것이 필요하다.
확장현실 데이터 시각화 오브젝트를 다수의 사용자들이 협업 분석하는 방식을 연구한 사례들을 살펴보면 다음과 같다. 우선, ART(Augmented Reality above the Tabletop) 시스템 [15]에서는 두 명 이상의 참가자가 XR 디바이스를 착용한 뒤 Touch-sensitive tabletop 위에 매핑된 3차원 형태의 Parallel Coordinate을 가지고 군집분석(cluster) 및 이상치(outliers)를 찾는 방법을 소개하였다. 해당 연구는 터치 스크린을 기준으로 공간 구성이 되므로 가상 현실에 매핑된 시각화의 오버플로팅(overplotting) 현상을 줄이는 장점이 있다. 또한, 증강현실 및 터치 스크린 기반 평면 인터랙 션을 적절히 조합하여 데이터 분석에 대한 몰입감을 향상시켰다. 그러나 해당 연구에서 소개한 시스템은 Video see-through 기능의 품질 저하 및 지연 현상 발생이 있었다. 그리고 유선 연결 방식의 HMD를 착용하여 공간 이동의 제약이 있었기 때문에 협업을 진 행하는 다른 사용자의 분석 위치를 확인하기 어려워 토론 중에는 시각화에만 집중하게 되는 문제가 있었다.
다음으로 FIESTA(Free-roaming Immersive Environment to Support Team-based Analysis) [11] 에서는 세 명의 참여자가 팀을 이루어 공유 작업 공간에서 2D 시각화를 벽면에, 3D 시각화를 주 변 공간에 생성하며 협업하는 연구를 제시하였다. 해당 연구에서 는 다수의 그룹이 협업을 진행할 때 지연 없는 네트워크 환경을 제공했다는 장점이 있다. 또한, 협업자의 분석 위치를 아바타로 표현하여 정보를 제공하였다. 그러나 특수 장비를 착용하여 진 행하는 방식이 행동의 제약을 발생시켰다. 그리고 잠재적 충돌 위험으로 인해 협업자들이 각자의 위치에서만 주로 분석을 진행 하며, 다른 사용자의 영역으로 자유롭게 이동하여 협업을 진행하 지 못하는 한계가 있다.
이후 리모트 환경 기반 시각화 협업 연구들이 진행되었다. Wizualization [16]은 리모트 환경에서 MR 디바이스를 사용하는 두 사용자가 터치형 상호작용 제스처와 음성명령을 이용하여 시 각화를 조작하는 방법을 제시한다. 해당 사례는 사용자들 간의 시각적 분석의 자유도를 높여준다는 장점이 있지만 분석 결과물 을 장기적으로 기억하도록 돕거나 시각화 분석 방법을 안내할 수 있는 인터페이스를 연구하는 부분이 추가로 필요하다고 언급했 다. 다음으로 분산형 비대칭 공동 시각화(Distributed Asymmetric Collaborative Visualization)에 대한 연구 [17]가 진행되었다. 해당 연구에서는 네트워크의 관계 분석을 위한 시각화 시스템을 제작 하고 비대칭(PC-VR) 및 대칭(PC-PC/VR-VR) 환경에서 시각화 협업 수행 정도를 비교 실험하였다. 실험 결과 비대칭 디바이스 를 사용하는 경우가 협업 수행에 긍정적인 인지 효과를 얻는다는 것을 발견하였다. 그러나 VR 디바이스에서는 네트워크 시각화 를 쉽게 제어하기 어려운 문제가 있어, 가상현실 공간 안에서 데 이터 인스턴스의 특징을 매핑하고 이를 리포팅하는 역할을 주로 수행하는 한계가 있었다.
몰입형 분석을 위한 협업 환경 연구들을 종합해 볼 때, 개선된 연구를 진행하기 위해서는 이기종 디바이스 사용자들에게 분석 방법을 안내하고 업무 내용 및 과정을 저장할 수 있는 기능을 제 공하며, 각 디바이스들이 서로 독립적으로 데이터 시각화 분석을 진행할 수 있도록 시스템을 설계할 필요가 있다.
3. 확장현실 기반 데이터 시각화 시스템
본 연구는 PC 및 VR 디바이스 사용자들이 리모트 환경 속에서 확장현실 기반 시각화를 절차에 따라 생성하고, 만들어진 시각화 를 자유롭게 협업 분석하여 데이터로부터 통찰력을 얻을 수 있는 시스템을 제안한다. 시스템은 아래의 두 가지 설계 목적(design goal)을 가지고 제작되었다.
-
G1. 사용자들이 특정 디바이스의 의존성 없이 데이터 시각 화의 전체적인 플로우(flow)를 제어하는 동일한 인터페이스 를 제공해야 한다.
-
G2. 이기종 디바이스 간의 통신을 가능하게 하여 사용자들 이 리모트 환경에서도 실시간으로 협업 분석을 수행하고 작 업 내용을 공유/배포할 수 있어야 한다.
3장에서는 설계 목적에 따른 시스템 제작 과정 및 구현 방식에 대한 내용을 소개한다. 3.1에서는 시스템 공간 디자인 및 인터페 이스 조작 방식, 시스템 구현 방식을 설명한다. 3.2에서는 시스 템에서 제공하는 세 가지의 시각화 테크닉의 기능 및 노드-링크 제어 인터페이스 대해 언급한다.
시스템은 PC 버전과 VR 버전으로 나뉘며, 각 디바이스에서 모두 동일하게 노드-링크 기반의 제어 인터페이스와 시각화 뷰(view) 를 제공한다(G1). 이때, 시스템의 전체 GUI는 완전한 형태의 미 러링(mirroring) 형식을 따르지 않고각 디바이스의 사용 편의성 을 고려할 수 있도록 배치 디자인을 하였다.
PC 버전(Figure 2)은 평면형 모니터에서 시각화를 생성한 뒤 분 석 업무(analytic task) [18]를 진행할 수 있는 뷰를 왼편에 제공한 다. 해당 뷰는 노드-링크 제어 인터페이스를 보여주며, 사용자는 Node List 메뉴에서 원하는 노드를 생성하고 연결하여 시각화를 제어한다. PC 버전의 오른편에는 만들어진 시각화 오브젝트들이 가상 공간에 매핑되는 뷰가 제공된다.
그리고 VR 버전(Figure 3)에서는 사용자의 정면에 반투명 패 널을 배치하고각 노드-링크 인터페이스를 패널 위에 배치하여 가상 공간에서 노드-링크의 확장을 편리하게 관리하도록 했다. 시각화 오브젝트는 패널 뒤에 일렬로 매핑되도록 설정했으며, 사 용자가 노드-링크 인터페이스의 인터렉션을 진행한 뒤 시야를 돌 려 시각화가 바로 업데이트되는 것을 확인하도록 했다.
각 디바이스의 인터페이스 조작법에 대해 서술하면 다음과같 다. 우선 PC는 키보드와 마우스를 이용해 노드-링크 제어 인터페 이스를 조작한다. PC에서 마우스 왼쪽 버튼을 클릭해 노드를 생 성하고 데이터를 선택한다. 그리고 마우스 오른쪽 버튼을 클릭한 상태에서 드래그하여 각 노드의 위치를 변경한다. 시각화의 접근 및 이동을 위해서는 키보드의 w,s,a,d 키와 방향키를 사용한다. 인스턴스의 변수값을 확인하기 위해서는 마우스 커서를 인스턴 스 위치에 호버링하거나 마우스 왼쪽 버튼을 클릭하여 팝업 창을 띄운다.
VR은 컨트롤러 디바이스를 이용해 노드-링크 제어 인터페이 스를 조작한다. VR에서 원하는 노드 버튼에 컨트롤러로부터 나 가는 선을 갖다댄 다음 트리거 버튼을 클릭하여 노드를 활성화/ 비활성화할 수 있다. 그리고 왼쪽 또는 오른쪽 컨트롤러의 트리거 버튼을 클릭해 노드를 생성하고 데이터를 선택한다. 또한, 왼쪽 또는 오른쪽 컨트롤러 중 한 컨트롤러의 트리거 버튼을 누르는 상태에서 컨트롤러를 움직여 전체 노드의 위치를 변경한다. 시 각화 오브젝트의 관찰을 위해서는 시선을 상하좌우로 움직이고 걸어서 이동하거나 조이스틱을 사용한다. 인스턴스의 변수값을 확인하기 위해서는 오른쪽 컨트롤러의 포인터(pointer)를 이용하 여 인스턴스와 충돌시켜 팝업 창을 띄운다.
본 연구의 시스템은 Unity Game Engine을 통해 개발되었으며, PC 구현 환경은 Windows11, intel i7-10700k, DDR4 32GB RAM, NVIDIA GTX 1080 이다. 또한, VR 디바이스는 Meta MetaQuest 3 및 MetaQuest 2에서 테스트 되었다. 클라이언트(client) 간 네 트워크 동기화 작업은 이벤트(event) 중심으로 이뤄진다. 이때, 이벤트는 클라이언트가 행위하는 특정 행동의 결과라 볼 수 있 으며, Table 1과 같은 구조를 가지고 있다. PC 및 VR 클라이언트 간의 리모트 협업을 위해 서버(server)를 이용하여 네트워크를 구 현하였다. 이 네트워크 안에서 모든 클라이언트의 이벤트 활동은 공유되며, 개별 클라이언트들은 실시간으로 변동되는 다른 클라 이언트의 작업 환경을 확인하고 수정하며 협업을 수행할 수 있다 (G2).
네트워크의 송수신은 일련의 처리과정을 거쳐서 진행된다. 우 선 특정 클라이언트가 이벤트를 발생시키면, 해당 이벤트와 관 련된 고유한 정보들이 NetworkEvent라는 하나의 데이터로 구조 화되고, 이 데이터가 서버로 송신된다. 그렇게 되면 서버는 수 신한 데이터를 접속해 있는 모든 클라이언트에게 브로드캐스팅 (broadcasting)하게 된다. 이렇게 되면 각 클라이언트들은 수신한 데이터에서 EventID, SourceID, NodeID, Payload를 확인하여, 새 로운 노드가 생성되거나 기존 노드의 업데이트가 진행된다. 이러 한 과정을 통해서 네트워크 동기화가 이뤄져 모든 클라이언트는 실시간으로 동일한 데이터시각화 협업 과정을 수행하게 된다.
본 연구의 시스템에서 제공하는 시각화 테크닉 유형은 총 세 가 지로 Bar Chart, Scatterplot, Parallel Coordinate으로 구성된다.
우선, Bar Chart는 사용자가 지정한 하나의 변수에 대해서 각 변수 구간에 속하는 데이터 인스턴스의 빈도를 보여준다. 사용자 들은 해당 시각화를 매핑한 뒤 각 변수 구간에 위치하는 막대그 래프 위 숫자 정보를 통해 빈도(frequency)값을 파악할 수 있다.
다음으로 Scatterplot은 2D와 3D 모드를 지원하며 사용자가 지 정한 두 변수 또는 세 변수에 대한 상관 관계 정보를 보여준다. 시각화를 매핑한 사용자는 데이터 인스턴스 분포를 관찰하여 구 성된 변수에 대한 관계가 양/음의 상관관계 또는 무상관관계를 가지는 지 볼 수 있다.
Parallel Coordinate는 2D와 3D모드를 제공한다. 해당 시각화 에서는 다양한 종류의 변수를 평행한 축에 위치시킨 다음, 각 변수의 속성값을 라인 그래프로 나타낸다. 기존의 확장현실 기 반 Parallel Coordinate 시각화는 한 축에 하나의 변수를 고정 하는 형식이 대부분이었으며 [7, 12, 13] 데이터의 입력 방식을 SDK(Unity 등)의 인스펙터 창에서만 제어할 수 있었다 [8, 13]. 본 연구에서는 가상 공간에서 사용자가 직접 변수를 적용하고, 축의 위치를 자유롭게 이동할 수 있는 기능을 적용하여 시각화 분석에 대한 편의성을 증대시켰다. 3D Parallel Coordinate 시각 화는 기존 연구인 Be The Data [13]와 ART [15]의 시각 디자인을 참고하였으며, 각 축의 모양을 2차원 평면 형태로 시각화를 매 핑하였다. 이때, Z축에도 다차원 데이터의 변수를 적용하여 해당 변수에 따라 인스턴스의 분포를 나타내어 비쥬얼 클러터의 문제 를 줄였다.
시스템에 매핑된 세 종류의 시각화에 대해서 데이터 인스턴스 가 가지는 변수 값은 데이터 패널(data panel) 팝업 창 형태로 제 시된다(Figure 4). 해당 정보를 보기 위해서 PC 사용자는 데이터 인스턴스에 마우스 커서를 갖다 놓을 때, VR 디바이스 사용자는 데이터 인스턴스에 포인터를 접촉시킬 때 확인이 가능하다.
시스템을 접속한 사용자들은 원하는 데이터셋을 선택한 뒤 변 수를 선정하고 이를 시각화한다. 또한, 만들어진 시각화에서 데 이터 인스턴스들의 특징 파악을 위한 분석 작업을 진행한다. 이 때, PC 및 VR 사용자가 용이한 협업 분석을 위해서는 각 사용 자가 독자적으로 시각화를 인터랙션할 수 있는 수단이 필요하다 (G1,G2). 본 연구에서는 업무 지향 형식 [18]의 노드-링크 제어 인터페이스를 제공하여 각 디바이스의 사용자들이 자유롭게 데 이터를 편집하고 시각화를 매핑한 뒤, 절차에 따라 분석을 진행 하도록 하였다 (Figure 5의 (a), (b) 참고).
노드-링크 제어 인터페이스는 크게 데이터 설정 노드(Data Setting), 시각화 기법 선택 노드(Visualization Technique), 변수 선택 노드(Data Attribute), 분석 작업을 위한 노드(Retrieve Value, Filter, Determine Range), 시각화 분석 결과를 정리하여 태그 형태로 남길 수 있는 노드(Tag&Report) 등으로 구성된다. 각 디바이스 사용자들은 Node List 메뉴에서 원하는 버튼을 선택하여 노드를 생성할 수 있다(Figure 5의 (c) 참고). 그리고 다음 단계의 노드를 생성하기 위한 인터랙션을 진행하면, 이전에 생성된 노드와 자동 적으로 링크가 되는 방식으로 노드 연결을 설정하였다.
시각화를 생성하고 분석하기 위한 노드-링크 제어의 방식을 설 명하면 다음과 같다. 우선 데이터 시각화 매핑을 위해서는 ‘Data Setting’ 노드를 먼저 생성한다. 해당 노드에서는 사용자가 업로 드한 데이터셋을 선택할 수 있다. 둘째로, ‘Visualization Technique’ 노드를 선택하여 시스템에서 제공하는 세 개의 시각화 테 크닉 중 원하는 테크닉을 선택한다. 해당 노드를 선택할 때에는 미리 생성해 둔 ‘Data Setting’ 노드와 링크가 자동 연결된다. 셋째 로, ‘Data Attribute’ 노드를 선택하면 해당 노드는 ‘Visualization Technique’ 노드와 자동 연결된다. ‘Data Attribute’ 노드는 사용자 가 선택한 시각화 테크닉에 따라 변수를 선택하는 모드가 나뉜다. 예를 들어 Bar Chart에서는 변수 리스트에서 하나의 변수만을 선 택할 수 있으며, Scatterplot에서는 두 개 또는 세 개의 변수를 선 택할 수 있도록 했다. Parallel Coordinate에서는 여러 축들을 선 택할 수 있는 체크박스와 3D Parallel Coordinate를 만들기 위한 Z축 선택 메뉴, 그리고 축의 순서를 바꿀 수 있는 메뉴를 제공한 다. 넷째로, 변수 선택이 끝난 뒤 시각화 매핑을 진행하는 버튼을 누르면 ‘Data Attribute’ 노드는 ‘Visualization’ 노드와 연결된다. ‘Visualization’ 노드가 생성되는 시점부터 시각화 오브젝트가가 상공간에 매핑된다. ‘Visualization’ 노드는 만들어진 시각화의 모 습을 보이게 하거나 사라지게 하는 기능을 제공한다.
사용자가 ‘Data Setting’, ‘Visualization Technique’, ‘Data Attribute’, ‘Visualization’의 순서로 노드를 만든 다음에는 시각화 분석 작업을 진행할 수 있다. 제공하는 업무는 총 세 가지이며 Amar의 연구 [18]에서 제시한 업무 중 일부를 활용하였다(Figure 6 참고). 시각화를 생성한 뒤 분석 업무 노드를 연결하면 시각 화 뷰에서는 원본 시각화와 분석 업무가 적용된 시각화가 동시에 매핑되어, 전후 모습을 쉽게 비교할 수 있다(Figure 8 참고).
첫째로, ‘Retrieve Value’ 노드는 만들어진 시각화 오브젝트에 서 데이터 인스턴스를 단일 선택하거나 복수 선택했을 때 선택된 인스턴스들의 값(단일 선택의 경우) 및 평균값(복수 선택의 경우) 을 제공한다. PC 마우스 클릭 또는 사각형 커서 드래그 방식으 로 데이터 인스턴스를 선택하며, VR 디바이스에서는 Bar Chart 와 Parallel Coordinate일 때 포인터를 인스턴스에 접촉시는 방법 그리고 Scatterplot에서는 Cube 및 Sphere형태의 브러시(brush)를 사용하는 방법으로 데이터 인스턴스를 선택한다.
둘째로, ‘Filter’ 노드는 필터링 작업이 필요한 변수를 선택하 고, 필터링 커서를 이용하여 변수값의 범위를 설정하여 원하는 데이터 인스턴스만을 컬러링할 수 있는 기능을 제공한다. 필터링 커서의 조작 및 체크박스의 선택은 PC에서는 마우스 클릭 및 드 래그 인터랙션으로, VR 디바이스에서는 포인터를 이용하여 선택 하고 드래그하는 인터랙션(MetaQuest 3를 기준으로 왼쪽/오른쪽 트리거 버튼을 사용)을 통해 이루어진다.
셋째로, ‘Determine Range’ 노드는 사용자가 선택한 변수에 대 해 레인징 커서를 이용하여 범위를 설정하고 데이터 인스턴스들 의 분포와 밀도를 조정하는 기능을 제공한다. 각 디바이스에서 해당 노드를 인터랙션하는 방식은 Filter 노드의 인터랙션 방식과 동일하다.
시각화 분석을 진행하는 과정에서 사용자들이 분석 결과물을 기록하기 위해서는 ‘Tag&Report’ 노드를 활용한다. 해당 노드에 서는 진행된 시각화의 사진과 내용을 남길 수 있다. 해당 Tag는 가상공간 속의 시각화 오브젝트에 남겨져 있어, 다른 사용자가 해당 Tag를 선택했을 때 분석 기록을 볼 수 있다. ‘Tag&Report’ 노드 기능은 현재 본 연구의 시스템에서 구현 및 안정화를 위한 준비를 진행 중이다.
본 연구의 인터페이스는 과학적 데이터 시각화를 분석하는 데 있어 필요한 과정(데이터 편집-시각화 생성-시각화 분석-데이터 셋 저장 및 관리)을 반영하여 노드-링크를 구조화할 수 있다. 해당 설정으로 인해 사용자들은 노드-링크를 단일 방향으로 살펴보면 서 전반적인 분석 업무 과정을 쉽게 파악할 수 있다. 이는 기존의 노드-링크 다이어그램 기반의 컨트롤러 [19, 20, 21]의 ‘1대다’ 형 식의 연결 작업 방식과는 차이가 있다.
4. 협업 리모트 인터랙션 시나리오
4 장에서는 PC 사용자 및 VR 디바이스 사용자가 본 연구의 시 스템을 접속하여 데이터를 업로드하고 시각화 협업 분석을 진행 하는 리모트 인터랙션 과정을 시나리오 형식으로 소개한다. 해당 시나리오에서는 04 car dataset을 가지고 진행되며, VR 디바이 스 사용자 A와 PC 사용자 B가 협업 분석을 진행한다. 전반적인 시나리오의 프로세스는 Figure 8과 같으며, 시나리오의 주제는 아래와 같다.
시나리오의 주제: 서로 다른 공간에서 이기종 디바이스를 사용 하는 두 사용자가 시스템에 접속한 뒤 Parallel Coordinate를 생성 하고 1) 상관관계를 비교하기 위한 Scatterplot 시각화를 생성한 뒤 협업 분석을 진행하며, 2) 범위 설정 및 필터 작업을 통해 추출 된 데이터 인스턴스의 특징을 살펴본다.
우선 VR 디바이스 사용자 A는 Parallel Coordinate를 만들기 위 한 인터랙션을 진행한다. 노드-링크 컨트롤 인터페이스에서 04 car data.csv 파일 로드가 완료된 ‘Data Setting’에다 ‘Visualization Technique’노드를 연결시킨다. 해당 노드에서는 Parallel Coordinate 버튼을 누른다. 다음으로 Parallel Coordinate의 변수 설정을 위해 ‘Attribute Selection’ 노드를 연결시킨 후, Engine Size, Cly, HP, City MPG, Hwy MPG, Weight 변수를 선택한다. 그런 다음 Show Visualization 버튼을 클릭하여 시각화를 생성한다.
이때, PC 사용자 B는 사용자 A가 만든 Parallel Coordinate를 동시에 관찰하면서 첫째 분석 업무인 ‘상관관계 비교(4.2.1장에 서 자세히 서술)’를 위한 변수들을 짝지어본 뒤, 사용자 A에게 Parallel Coordinate의 변수 순서 변경을 요청한다. 동시에 사용자 A는 ‘Axis Order Panel’을 이용하여 변수의 순서를 Cyl, Weight, Engine Size, City MPG, HP, Hwy MPG로 변경한다. 해당 변수로 순서를 변경하면 HP를 기준으로 HP-City MPG, HP-Hwy MPG 의 상관관계를 비교할 수 있고, Weight를 기준으로 Weight-Cyl, Weight-Engine Size의 상관관계를 비교할 수 있다. 사용자 B는 좀 더 확실한 비교를 위해 네 가지의 상관관계를 비교하기 위한 Scatterplot을 생성한다. 동시에 사용자 A는 생성된 네 개의 Scatterplot을 모니터링한다.
변수의 순서가 조정된 Parallel Coordinate와 네 개의 Scatterplot 에 대해서 두 사용자는 총 두 가지의 업무를 수행한다.
만들어진 네 개의 Scatterplot 중 사용자 A는 Cyl-Weight, Engine Size-Weight가 양의 상관관계를 가진다는 것을 확인하고, 이들 을 비교 관찰한다. 그 결과 Engine Size-Weight의 경우가 강한 양 의 상관관계를 보이는 것을 확인한다. 동시에 사용자 B는 City MPG-HP, Hwy MPG-HP가 음의 상관관계를 가진다는 것을 확 인하고, 이들을 비교 관찰한다. 그 결과 City MPG-HP의 경우가 강한 음의 상관관계를 보이는 것을 확인한다.
변수 조정이 이루어진 Parallel Coordinate를 가지고 두 사용자가 범위 설정 및 필터 작업을 진행한 뒤 그에 따라 추출되는 데이터 인스턴스의 특징을 파악하는 작업을 진행한다. 먼저 사용자 A는 만들어진 Parallel Coordinate 시각화에 ‘Determine Range’ 노드 를 연결시킨 다음, City MPG 변수를 선택 후 20 이상 60 이하로 값으로 설정한다. 곧이어 사용자 B는 Weight 변수를 2000 이상 7190 이하로 설정한다. 각 사용자가 범위 설정을 하면, City MPG 및 Weight을 구성하는 데이터 인스턴스 라인 그래프의 분포 밀도 가 달라진다.
다음에는 ‘Determine Range’가 적용된 시각화 노드를 기준으 로 사용자 B가 ‘Filter’노드를 연결한 뒤, Cly 변수를 선택 후 3 이상 5 이하로 조절한다. 이후 사용자 A는 해당 ‘Filter’ 노드에서 HP 변수를 선택 후 150 이상 160 이하로 조절한다. 각 사용자가 필터 설정을 하면, Parallel Coordinate 시각화에서는 필터 범위값 에 속하는 데이터 인스턴스 라인 그래프만 빨간색으로 표시되고, 그 외 범위에 해당하는 데이터 인스턴스들은 무채색으로 변한다. 최종 분석 업무 진행 뒤, 남겨진 데이터 인스턴스들을 토대로 두 사용자는 범위 조정된 변수에 대한 분포 및 그 외 모든 변수에 대한 데이터의 특성을 분석하고 논의한다.
5. 사용성 평가
본 장에서는 시스템 사용성을 알아보기 위한 실험 과정 및 결과 를 다룬다. 이기종 디바이스 사용자들의 독립적인 인터랙션 및 리모트 환경에서 협업 분석 지원하는 시스템은 현재 비슷한 비 교군을 찾기 어려운 상황이며, 본 연구의 시스템도 향후 버전업 (분석 업무 추가, 프로젝트 관리 기능 강화, 네트워크 및 프로젝트 공유 환경 개선 등)이 필요하다. 해당 사유로 인해 양적 검증이나 비교 실험 대신 파일럿 실험을 진행하기로 했다.
사용성 검증을 위한 실험 설계 방법을 서술하면 아래와 같다. 우 선, 본 시스템의 협업 분석을 위해 관련 분야의 전공자 네 명(남자 3명, 여자 1명, 나이 24-35, 모두 VR 및 PC 사용 가능)을 피실험자 로 선정하였다. 실험 장소로는 물리적으로 떨어진 두 공간을 확 보한 뒤, 각 공간에 VR 디바이스와 PC 디바이스를 배치시켜 두 디바이스가 서로 리모트 인터랙션을 할 수 있도록 설정하였다. VR 디바이스는 Meta Quest 3 HMD 및 컨트롤러를 사용하였다. 피실험자 네 명은 각각 두 명씩 팀을 이루어 협업 분석을 진행하 며, 협업 분석의 내용은 4장에서 소개한 협업 시나리오 과정을 순 서대로 체험하는 방식으로 구성되었다. 그리고각 팀은 총 2회에 걸쳐서 협업 분석을 진행한다. 예를 들어 피실험자 1과 2가 있을 때, 1차 협업 분석에서는 피실험자 1이 VR을 사용하고, 피실험자 2가 PC 사용하여 시나리오 협업 분석을 진행한다. 2차 협업 분 석에서는 두 피실험자가 디바이스를 바꾸어서 동일한 시나리오 협업 분석을 진행한다. 피실험자 3과 4도 앞서 설명한 방법대로 총 2회에 걸친 협업 분석을 진행한다.
파일럿 실험을 진행할 때는 실험 진행자가각 피실험자에게 시 스템에서 제공하는 시각화의 기능, 사용하는 04 car data의 특징, 노드-링크 제어 인터페이스의 사용 방법, 각 디바이스의 컨트롤 러 제어 방법을 설명하였다. 또한, 제시되는 시나리오를 피실험 자들이 충분히 협업 분석할 수 있는 수준까지 이해하도록 학습 및 질의 응답을 실시하였다. 피실험자들은 협업 시나리오를 진행할 때 시나리오에 대한 메뉴얼(Figure 8)이 제공된다. 각 피실험자는 현재 자신이 사용하는 디바이스에서 메뉴얼에 따라 협업 분석을 진행하고 디바이스를 변경하여 같은 과정을 한 번 더 진행한다.
협업 분석을 진행한 후에는, 분석된 데이터의 특징을 올바르 게 이해하는 지 측정하기 위해 각 피실험자들에게 문항에 응답하 도록 하였다. 문항은 총 세 종류로 구성되며 첫째는 City MPG-HP 및 Hwy MPG-HP의 상관관계를 비교하는 문항, 둘째는 Cyl-Weight 및 Engine Size-Weigh의 상관관계를 비교하는 문항, 셋째 는 범위값 설정 및 필터링이 진행된뒤 추출되는 데이터 인스턴 스들의 특징을 서술하는 문항이다.
문항 응답 과정이 끝나고 나면, 각 피실험자들에게 Table 2의 질문 리스트를 기반으로 총 여섯 개의 서술형 응답을 진행하였 다. 질문 주제는 밝히지 않았으며, 부여된 문항 번호 순서대로 응 답이 이루어졌다. 그리고 3번-6번 문항에 대해서 리커트 5점 척 도를 활용하여 사용성 만족도(5점으로 갈수록 긍정적인 만족도) 를 측정하고, 해당 점수를 부여한 사유에 대해서도 서술하도록 요청하였다. 이후 피실험자가 작성한 응답에 대해서 추가 의견이 필요한 상황에는 해당 피실험자에게 인터뷰를 실행하였다.
피실험자들이 협업분석을 진행하기 위한 사전 설명 진행 단계 소요시간은 평균 24분이 소요되었다. 그리고 피실험자 1과 2가 진행하는 1차 협업 분석은 14분, 2차 협업분석은 13분이 소요되 었으며 피실험자 3과 4가 진행하는 3차 협업 분석은 13분, 4차 협 업분석은 10분이 소요되었다. 그리고각 팀이 주어진 세 개의 문 항을 푸는 시간은 평균 6분이 소요되었으며, 두 팀 모두 대체적으 로 데이터 해석의 오류 없이 올바른 분석 결과(1번 정답률:100%, 2번 정답률: 75% 3번 정답률: 100%)를 낸 것을 확인하였다. 이후 여섯 개의 서술 문항을 응답하고 인터뷰를 실행한 시간은 평균 11분이 소요되었다.
피실험자 네 명에게 받은 여섯 문항에 대한 응답을 순서대로 정리하면 아래와 같다.
PC 디바이스를 이용한 시스템 사용 의견을 묻는 1번 문항에 대 해서는, 모든 피실험자들이 노드-링크를 생성하여 자유롭게 조작 하고, 시각화 뷰의 확대/축소와 이동이 자연스럽게 이루어졌다는 점을 언급했다. 하지만 평면 모니터 안에서 노드-링크를 연속해 서 만들게 되면 한정된 공간으로 인해서 제약이 느껴진다는 점, 노드-링크 인터페이스를 이루는 노드 중 일부 버튼 글씨가 작게 보인다는 점을 단점으로 보았다.
VR 디바이스를 이용한 시스템 사용 의견을 묻는 2번 문항에 대해서는, 시각화가 입체적으로 보여서 비쥬얼 클러터가 감소한 다는 점,공간 제약을 벗어나기 때문에 시각화의 분석 결과물 수 치를 읽기가 더 편했으며 몰입감을 높인다는 의견을 주었다. 그 러나 노드-링크 제어 인터페이스에서 일부 노드들이 반투명 패널 밖에 위치하는 오류가 있었으며, 특히 모든 피실험자들이 컨트롤 러에 손떨림이 그대로 반영되는 문제로 인해서 선택 인터랙션을 진행하는 것이 어렵다는 것을 지적하였다.
노드-링크 제어 인터페이스의 사용성을 묻는 3번 문항에 대해 서는 평균 4점이 나왔다. 각 피실험자들이 해당 점수를 준 사유를 정리했을 때, 시각화를 생성하기 위해서는 데이터셋-시각화 테크 닉-변수의 선택을 간단하게 거치면 만들 수 있다는 점이 매우 직 관적이었으며, 만들어진 시각화에 여러 업무들을 붙여서 시각화 를 비교하는 점이 분석에 있어 용이하다는 의견을 주었다. 하지만 최저 점수인 3점을 준 피실험자는 노드-링크 제어 인터페이스는 직관적이지만, VR 디바이스를 이용했을 때 특정 인스턴스를 선 택하고 수치를 드래그하는 데 있어서 어려움이 있었던 점, 그리고 PC에서는 한정된 공간에서 이루어지다보니 전체 노드 크기가 작 아서 수치를 보거나 변수들을 볼 때 눈의 피로도가 증가한다는 점을 단점으로 보았다.
PC 기반 인터랙션의 정밀성을 측정하는 4번 문항에 대해서는 평균 4.75점이 나왔으며, 모든 피실험자들이 마우스를 기반으로 노드를 생성하여 시각화를 조작하는 데 있어 시스템이 충분한 반 응을 보이고 있다는 의견을 준 것으로 나타났다.
그러나 VR 기반 인터랙션의 정밀성을 측정하는 5번 문항에 대해서는 평균 2.25점이 나왔다. 상대적으로 낮은 점수를 부여한 사유를 확인한 결과, 모든 피실험자들이 VR 컨트롤러로 특정 오 브젝트를 선택하는 것에 대해서 불편함을 느낀 것으로 나타났다. 그리고 추가 인터뷰 과정에서 일부 피실험자는 컨트롤러를 사용 하여 노드를 옮길 때 주변 인터페이스들이 같이 눌려져서 반응하 는 점, PC도 인터페이스가 작다고 느꼈지만 VR도 일부 노드의 인터페이스는 여전히 크기가 작아서 사용이 불편했다는 점을 지 적하였다.
마지막으로 네트워크 환경을 이용하여 헙업 분석을 진행하는 데 있어 편의성을 측정하는 6번 문항에 대해서는 평균 3점이 나왔 다. 해당 점수를 부여한 사유를 정리한 결과, 피실험자들이 서로 공간에서 떨어져 있어도 노드를 이용하여 인터페이스를 조작하 고 시각화가 실시간으로 바뀌는 점에 대해서는 긍정적이었으나, VR의 성능이 PC만큼 따라주지 않는다는 디바이스의 한계로 인 해, PC 및 VR 디바이스들이 동등한 조작을 하더라도 VR쪽에서 는 불편함이 계속 발생될 것이라는 의견이 있었다. 그리고 추가 인터뷰 과정에서 일부 피실험자는 리모트 환경에서 이기종 디 바이스가 아닌 PC-PC 형태로 분석을 진행한다면 더욱 수월하게 협업을 진행할 수 있었을 것이라는 의견도 주었다.
파일럿 실험 결과 피실험자들은 ‘노드-링크 제어 인터페이스 를 사용하면 원하는 데이터셋과 변수들을 선택한 뒤 시각화를 매핑하고 시각화에 대한 분석 업무를 진행하는 데 있어 상당히 직관적이었으며, 시스템 사용에 대한 특별한 가이드라인 설명이 없어도 조작이 쉽다는 점에서 기여도가 높다고 생각한다.’라는 의견을 주었다. 또한, 협업 진행 시 통신의 품질 등에 대해서도 긍정적인 의견을 준 것으로 나타났다.
다만 VR 디바이스에서 컨트롤러 사용의 불편함, 일부 노드의 인터페이스 크기가 작아서 분석 진행에 어려움이 있었다는 점 등 은 본 연구에서 개선해야할 과제로 남았다.
6. 결론 및 향후 연구
본 연구는 리모트 환경에서 PC및 VR 사용자들이 확장현실 기반 데이터 시각화 분석을 진행하는 시스템을 소개하였다. 시스템을 토대로 협업 분석 시나리오를 설계한 뒤, 시나리오를 재현하여 파일럿 실험을 진행하였다.
그 결과 시스템을 구성하는 노드-링크 제어 인터페이스는 두 디바이스에 대해 시각화의 생성 및 분석 업무 편집에 대해 독자적인 사용성을 높였으며, 데이터 시각화 분석의 주요 과정을 이해하는 데 있어 적합한 도움을 주는 것으로 나타났다. 특히, VR 사용자들이 직관적인 인터페이스를 사용하여 데이터 분석 업무에 적극적으로 참여한다는 점은 큰 장점이라 할 수 있다. 그리고 시스템에 구현된 네트워크는 사용자들이 물리적으로 떨어져 있어도 실시간 협업 분석이 가능한 환경을 제공하였다. 또한, 시스템에서 이루어지는 협업 활동은 여러 단계의 분석 업무가 필요한 데이터셋의 특성을 노드-링크 제어 인터페이스를 이용하여 빠르고 체계적으로 정리하는 효과가 있다.
시스템은 설계한 두 목표(G1,G2)에 대해 긍정적인 연구
결과를 얻었으나, 여전히 몇 가지의 한계점이 남아 있다.
-
제시된 시스템은 초기 단계의 시스템으로, 데이터 시각화 분 석을 위해서 한정된 업무(Retrieve Value, Filter, Determine Range)만을 제공하고 있다.
-
다수의 사용자가 노드-링크 제어 인터페이스를 사용했을 때 다량으로 길게 생성되는 노드와 링크로 인해 인터랙션을 담 당하는 뷰의 가독성이 떨어지는 문제가 있다.
-
VR 디바이스에서 컨트롤러를 이용하여 특정 기능들을 선택 할 때 정밀성이 떨어지고 사용의 불편함이 존재한다.
-
제시된 시스템은 시각화의 협업 분석에만 초점을 맞춘 관계 로, 사용자 커뮤니케이션(글 작성, 음성 대화 등)이 제한적인 문제가 있다.
-
파일럿 실험에 초대된 피실험자의 표본 수가 적어 시스템에 대한 다양한 방향의 의견을 충분히 수집하지 못했다.
이상의 한계점들을 보완하기 위해, 본 연구는 향후 다음과 같이 후속 연구를 진행할 계획이다. 우선 Amar의 연구 [18]에서 제시 하는 세 가지 업무 이외에도 ‘기술통계값 계산’, ‘상관관계 분석’, ‘극값 찾기’, ‘이상치값 찾기’, ‘군집 분석’, ‘분포 특성 파악’의 분 석 업무를 지원할 것이다. 다음으로 노드-링크 제어 인터페이스 는 사용자가 원하는 구간들을 유연하게 축소/확장할 수 있도록 보 완할 예정이다. 그리고 VR 디바이스의 사용성을 높일 수 있도록 인터페이스 조작과 시각화 뷰의 공간 배치를 조정하고, 노드의 크 기를 조정할 수 있는 기능을 추가할 계획이다. 또한, Tag&Report 노드 기능을 완성하고 실시간 음성 채팅 기능을 추가하여 사용 자들이 자유로운 커뮤니케이션 환경속에서 협업 분석의 능률을 높이도록 만들 것이다.
본 연구의 시스템은 이기종 디바이스 간의 협업 분석 이외에도 PC-PC/VR-VR간의 리모트 협업 분석, 다수의 PC와 VR이 접속 하여 협업 분석을 진행하는 것도 충분히 가능하도록 설계되었다. 따라서 향후에는 다수의 사용자들을 대상으로 한 시나리오를 추 가로 설계하여 시스템의 활용도를 높일 예정이다. 또한, 단순히 노드-링크 인터페이스와 생성된 시각화들을 저장하고 공유하는 기능을 넘어, 협업 분석이 이루어지는 공간을 프로젝트 단위로 관리하고 이를 제 3자에게 공유하는 기능도 추가할 계획이다.