1 minute read

Scene Scaling and Learning Rate in Gaussian Splatting

Gaussian Splatting ๋ฐฉ๋ฒ•์—์„œ๋Š” ์žฅ๋ฉด์˜ ์Šค์ผ€์ผ์— ๋งž์ถฐ ํ•™์Šต๋ฅ ์„ ์กฐ์ •ํ•˜๋Š” ๊ฒƒ์ด ์ค‘์š”ํ•ฉ๋‹ˆ๋‹ค.

์ด ๋ฐฉ๋ฒ•์˜ 3dgs original paper ์ €์ž๋“ค์ด ๊ฐ•์กฐํ•œ ๋ฐ”์™€ ๊ฐ™์ด, ์นด๋ฉ”๋ผ ์œ„์น˜์˜ ๋ฐ˜์ง€๋ฆ„(์ฆ‰, ์žฅ๋ฉด์˜ ์Šค์ผ€์ผ)์— ๋น„๋ก€ํ•˜์—ฌ position learning rate๋ฅผ ์กฐ์ •ํ•˜๋ฉด, ๋ฐฉ๋ฒ•์ด ์žฅ๋ฉด์˜ ์ผ๋ฐ˜์ ์ธ ์Šค์ผ€์ผ์— ๋Œ€ํ•ด ๋ถˆ๋ณ€ํ•˜๊ฒŒ ๋ฉ๋‹ˆ๋‹ค.

1. Position Learning Rate์˜ ์—ญํ• 

์ •์˜: position learning rate๋Š” ํ•™์Šต ๊ณผ์ •์—์„œ Gaussian๋“ค์ด ์žฅ๋ฉด ๋‚ด์—์„œ ์–ผ๋งˆ๋‚˜ ์›€์ง์ผ ์ˆ˜ ์žˆ๋Š”์ง€๋ฅผ ๊ฒฐ์ •ํ•ฉ๋‹ˆ๋‹ค.

  • large position learning rate: Gaussian๋“ค์ด ํฐ ์›€์ง์ž„์„ ํ•˜๊ธฐ ์–ด๋ ต๊ฒŒ ๋งŒ๋“ญ๋‹ˆ๋‹ค.
  • small position learning rate: Gaussian๋“ค์ด ์ž‘์€ ์›€์ง์ž„์„ ํ•˜๊ธฐ ์–ด๋ ต๊ฒŒ ๋งŒ๋“ญ๋‹ˆ๋‹ค.

2. ์žฅ๋ฉด ์Šค์ผ€์ผ๋ง ์ ์šฉ ์˜ˆ์‹œ

๋‘ ๊ฐœ์˜ ๋™์ผํ•œ ๋ฐ์ดํ„ฐ์…‹: ๋™์ผํ•œ SfM ํฌ์ธํŠธ ํด๋ผ์šฐ๋“œ์™€ ๋™์ผํ•œ ์นด๋ฉ”๋ผ ์œ„์น˜๋ฅผ ๊ฐ€์ง„ ๋‘ ๊ฐœ์˜ ๋ฐ์ดํ„ฐ์…‹์ด ์žˆ๋‹ค๊ณ  ๊ฐ€์ •ํ•ฉ๋‹ˆ๋‹ค.

์Šค์ผ€์ผ ์กฐ์ •: ๋‘ ์žฅ๋ฉด ์ค‘ ํ•˜๋‚˜์˜ ์Šค์ผ€์ผ์„ 2๋ฐฐ๋กœ ์ฆ๊ฐ€์‹œํ‚ต๋‹ˆ๋‹ค. ์ฆ‰, ์นด๋ฉ”๋ผ ์œ„์น˜์™€ SfM ํฌ์ธํŠธ ํด๋ผ์šฐ๋“œ์˜ ์ขŒํ‘œ์— 2๋ฅผ ๊ณฑํ•ฉ๋‹ˆ๋‹ค.

3. ํ•™์Šต๋ฅ  ์กฐ์ •์˜ ํ•„์š”์„ฑ

์Šค์ผ€์ผ ์ฆ๊ฐ€์— ๋”ฐ๋ฅธ ํ•™์Šต๋ฅ  ์กฐ์ •:

  • ์Šค์ผ€์ผ์ด ์ปค์ง„ ์žฅ๋ฉด์˜ ํ•™์Šต๋ฅ ์„ 2๋ฐฐ๋กœ ์ฆ๊ฐ€์‹œํ‚ค๋ฉด ๋‘ ์žฅ๋ฉด์€ ๋™์ผํ•˜๊ฒŒ ์ตœ์ ํ™”๋ฉ๋‹ˆ๋‹ค.
  • ํ•™์Šต๋ฅ ์„ ์กฐ์ •ํ•˜์ง€ ์•Š์œผ๋ฉด, ์Šค์ผ€์ผ์ด ์ปค์ง„ ์žฅ๋ฉด์—์„œ ํ•™์Šต๋ฅ ์ด ๋„ˆ๋ฌด ์ž‘์•„์ ธ ๋‘ ์žฅ๋ฉด์ด ๋‹ค๋ฅด๊ฒŒ ๋™์ž‘ํ•˜๊ฒŒ ๋ฉ๋‹ˆ๋‹ค.

๋ฐฉ๋ฒ•์˜ robustness:

  • ํ•™์Šต๋ฅ ์„ ์žฅ๋ฉด์˜ ์Šค์ผ€์ผ์— ๋งž์ถฐ ์กฐ์ •ํ•˜๋ฉด, ๋ฐฉ๋ฒ•์ด SfM ์Šค์ผ€์ผ์— ์ƒ๊ด€์—†์ด ๊ฒฌ๊ณ ํ•ด์ง‘๋‹ˆ๋‹ค.
  • ์˜ˆ๋ฅผ ๋“ค์–ด, SfM ๋ฐฉ๋ฒ•์ด -1์—์„œ 1 ์‚ฌ์ด์˜ ์ขŒํ‘œ๋ฅผ ์ถœ๋ ฅํ•˜๋“  -10์—์„œ 10 ์‚ฌ์ด์˜ ์ขŒํ‘œ๋ฅผ ์ถœ๋ ฅํ•˜๋“  ๋™์ผํ•œ ๊ฒฐ๊ณผ๋ฅผ ์–ป์„ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

5. position_lr_init ๊ฐ’์˜ ์ค‘์š”์„ฑ

position_lr_init default ๊ฐ’: ๊ธฐ๋ณธ position_lr_init ๊ฐ’์€ ์ผ๋ฐ˜์ ์ธ ํฌ๊ธฐ์˜ ์žฅ๋ฉด์—์„œ ์ข‹์€ ์žฌ๊ตฌ์„ฑ์„ ์œ„ํ•ด ์ตœ์ ํ™”๋˜์–ด ์žˆ์Šต๋‹ˆ๋‹ค. general scene(COLMAP์œผ๋กœ ์–ป์€ scene)์—์„œ ๊ฐ์ฒด ํฌ๊ธฐ๊ฐ€ ์ „์ฒด ์žฅ๋ฉด์˜ 1/100์—์„œ 1/10 ์‚ฌ์ด์ธ ๊ฒฝ์šฐ, default ๊ฐ’์ด ์ ์ ˆํ•ฉ๋‹ˆ๋‹ค.

ํ•˜์ง€๋งŒ ํฐ ์žฅ๋ฉด์—์„œ์˜ ๋ฌธ์ œ๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค.

๋„์‹œ ๊ตฌ์—ญ ๊ฐ™์€ ํฐ ์žฅ๋ฉด์—์„œ๋Š” ๊ฐ์ฒด ํฌ๊ธฐ๊ฐ€ ์ „์ฒด ์žฅ๋ฉด์˜ 1/1000์ธ ๊ฒฝ์šฐ๊ฐ€ ๋งŽ์Šต๋‹ˆ๋‹ค.

์ด๋•Œ๋Š” ๊ธฐ๋ณธ position_lr_init ๊ฐ’์œผ๋กœ๋Š” ์ •ํ™•ํ•œ scene reconstruction์ด ๋ถˆ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค.

์ด ๊ฒฝ์šฐ position_lr_init ๊ฐ’์„ ๋‚ฎ์ถ”์–ด์•ผ ์žฌ๊ตฌ์„ฑ ํ’ˆ์งˆ์ด ํฌ๊ฒŒ ํ–ฅ์ƒ๋ฉ๋‹ˆ๋‹ค.


์ž‘์€ ํ•™์Šต๋ฅ ์˜ ๋ฌธ์ œ

ํ•™์Šต๋ฅ  (Learning Rate)

  • ์ •์˜: ํ•™์Šต๋ฅ ์€ Gaussian๋“ค์ด ํ•™์Šต ๊ณผ์ •์—์„œ ์žฅ๋ฉด ๋‚ด์—์„œ ์–ผ๋งˆ๋‚˜ ์›€์ง์ผ ์ˆ˜ ์žˆ๋Š”์ง€๋ฅผ ๊ฒฐ์ •ํ•˜๋Š” ๊ฐ’์ž…๋‹ˆ๋‹ค.
  • ์ž‘์€ ํ•™์Šต๋ฅ : Gaussian๋“ค์ด ์ž‘์€ ์›€์ง์ž„๋งŒ ํ•˜๊ฒŒ ํ•˜์—ฌ ๋” ์„ธ๋ฐ€ํ•œ ์กฐ์ •์„ ๊ฐ€๋Šฅํ•˜๊ฒŒ ํ•˜์ง€๋งŒ, ๋” ๋งŽ์€ Gaussian์ด ํ•„์š”ํ•˜๊ฒŒ ํ•ฉ๋‹ˆ๋‹ค.

์ž‘์€ ํ•™์Šต๋ฅ ์˜ ๋ฌธ์ œ

  • ์ž‘์€ ์›€์ง์ž„ ๊ฐ•์ œ: ์ž‘์€ ํ•™์Šต๋ฅ ์„ ์‚ฌ์šฉํ•˜๋ฉด Gaussian๋“ค์ด ์ž‘์€ ์›€์ง์ž„์„ ํ•˜๊ฒŒ ๋˜์–ด, ๋” ๋งŽ์€ Gaussian์ด ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค. ์ด๋Š” ๊ฐ์ฒด์˜ ๋””ํ…Œ์ผ์„ ์‚ด๋ฆด ์ˆ˜ ์žˆ์ง€๋งŒ, ์ผ๋ฐ˜์ ์ธ ์žฅ๋ฉด์—์„œ๋Š” ๋ถˆํ•„์š”ํ•˜๊ฒŒ ๋งŽ์€ Gaussian์ด ํ•„์š”ํ•˜๊ฒŒ ๋˜์–ด ๋ฉ”๋ชจ๋ฆฌ ํšจ์œจ์ด ๋–จ์–ด์ง‘๋‹ˆ๋‹ค.
  • ํฐ ์žฅ๋ฉด์—์„œ์˜ ์žฅ์ : ํฐ ์žฅ๋ฉด์—์„œ๋Š” ์ž‘์€ ํ•™์Šต๋ฅ ์ด ์žฅ๋ฉด์˜ ํฌ๊ธฐ์— ๋น„ํ•ด ์ž‘์€ ๊ฐ์ฒด์˜ ๋””ํ…Œ์ผ์„ ์‚ด๋ฆฌ๋Š” ๋ฐ ๋„์›€์ด ๋ฉ๋‹ˆ๋‹ค.

์š”์•ฝ:

  • ์ž‘์€ ํ•™์Šต๋ฅ ์€ ์ž‘์€ ๊ฐ์ฒด์˜ ๋””ํ…Œ์ผ์„ ์‚ด๋ฆฌ๋Š” ๋ฐ ์œ ๋ฆฌํ•˜์ง€๋งŒ, ์ผ๋ฐ˜์ ์ธ ์žฅ๋ฉด์—์„œ๋Š” ๋ฉ”๋ชจ๋ฆฌ ํšจ์œจ์ด ๋–จ์–ด์ง€๋Š” ๋ฌธ์ œ๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค.
  • ํฐ ์žฅ๋ฉด์—์„œ๋Š” ์ž‘์€ ํ•™์Šต๋ฅ ์ด ์œ ๋ฆฌํ•˜์—ฌ ๋” ์ •ํ™•ํ•œ ๋””ํ…Œ์ผ์„ ์žฌ๊ตฌ์„ฑํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

์ด์™€ ๊ฐ™์ด, ์žฅ๋ฉด์˜ ์Šค์ผ€์ผ์— ๋”ฐ๋ผ ํ•™์Šต๋ฅ ์„ ์กฐ์ •ํ•˜๋Š” ๊ฒƒ์€ Gaussian Splatting ๋ฐฉ๋ฒ•์˜ ์„ฑ๋Šฅ๊ณผ ํšจ์œจ์„ฑ์„ ๋†’์ด๋Š” ์ค‘์š”ํ•œ ์ „๋žต์ž…๋‹ˆ๋‹ค.

https://github.com/Anttwo/SuGaR/issues/30

image

image

Leave a comment