2080에서는 비슷하다고 영상에서 나왔는데 660 m 인 내 노트북에서는 느리길레 찾아본 자료 vulkan 에서는 push descriptor 로 openGL 에서는 SSBO / texture fetch 등으로 수행 가능함 5x5 buddha, Nvida 660m, 10만 삼각형, one commandbuffer with wait command queue 'basic' 'optimize lib' '16bit vertex fetch' 'position only 32bit' FVF : 0.2b 0.7b 0.7b 0.7b PUSH: 0.2b 0.4b 0.7b 0.7b 초당 몇억 삼각형 그리는 건지 테스트한건데 / 2080은 10억 근처에서 논다 http..
바로 vulkan에 넘길 정보를 얻는 건 힘들다. 그냥 정보를 보고 사용할 수 있게 하는게 가능하다 https://github.com/cdwfs/spokk/blob/a3f2a812e1472b213609e15ed20243a0489d0045/src/spokk/spokk_shader.cpp // Handle push constants. Each shader stage is only allowed to have one push constant range, // so if the SPIRV defines more than one block, we have to merge them here. 이렇게 나와있는데; 정확한 것은 불칸 API 업데이트로 겹치는 영역은 push cmd 날릴 때 겹치는 shader를 flag..
먼넘의 문법이; http://www.duskborn.com/wp-content/uploads/2015/03/AnIntroductionToSPIR-V.pdf https://www.khronos.org/registry/spir-v/specs/1.0/SPIRV.pdf https://github.com/google-admin/vulkan-cpp-library/blob/master/spirv-reflection/include/reflection/internal/intermediate_types.h 3.32 Instructions word count > opcode > result > operands 실제 disasemble 에서 보이는건, %5 = OpTypeFloat 32 %6 = OpTypeInt 32 0 %..
http://lifeisforu.tistory.com/408?category=837815 긴 설명; 머가먼지 그냥 길다 https://www.youtube.com/watch?v=nKCzD5iK71M 49:00 보면된다 실제 머가 되나 싶지만, 찍어보면 GPU 메모리는 device local 밖에 없었고, local visible visible / cohrent 조합 visible / chhrent / cache 이 가능함. AMD는 더 늘어날 수 있다는데; (gpu에 cache 영역이 따로 있다네) 머 하여간 스펙상 visible / cohrent 조합의 존재를 밖어 놓진 않았지만 자기 경험상 모든 장비가 해당 조합을 지원했고, cohrent를 굳이 빼는 장점은 모르겠다고 함 cache는 RW 버퍼 채워..
GPU 프로파일링 하면서 잊고 있었다. 이걸로 클럭 떨어지는 것 (버스트도) 막고 GPU-Z 로 잘 됬는지 보면 됨 SetStablePowerState.exe: Disabling GPU Boost on Windows 10 for more deterministic timestamp queries on NVIDIA GPUs https://developer.nvidia.com/setstablepowerstateexe-%20disabling%20-gpu-boost-windows-10-getting-more-deterministic-timestamp-queries RegOpenKeyEx > 32 bit에서 error code 2 발생 64 bit 로 바꾸거나 KEY_WOW64_64KEY 추가 더욱더 정확한건 Pr..
내 인생은 맨날 타이머 부터 시작인가; Dx12 > Dx11 에 이어 vulkan timer 제작 그런데 쓸만한게 보이지 않는다? 거대 그래픽 라이브러리인 The-Forge 이렇다; vkCmdCopyQueryPoolResults(pCmd->pVkCmdBuf, pQueryHeap->pVkQueryPool, startQuery, queryCount, pReadbackBuffer->pVkBuffer, 0, sizeof(uint64_t), VK_QUERY_RESULT_64_BIT | VK_QUERY_RESULT_WAIT_BIT); 쉰다? multithread 인지 확인 필요한데; https://github.com/ConfettiFX/The-Forge/blob/master/Common_3/Renderer/GpuP..
내가 겪은건 아니고, 보고 어떻게 대응하나 보고 있지만; 더럽게 많네 vkAcquireNextImageKHR crashes in validation layers if vkGetSwapchainImagesKHR hasn't been called \ https://github.com/KhronosGroup/Vulkan-ValidationLayers/issues/358 vkGetPhysicalDeviceSurfaceFormatsKHR doesn't fill format count correctly \ https://software.intel.com/en-us/forums/graphics-driver-bug-reporting/topic/797666 Fix NonWritable check when ..
최근에 보고 있는 동영상 https://www.youtube.com/watch?v=nKCzD5iK71M https://github.com/zeux/niagara 예제도 잘 안나온 RTX 등의 extension을 어떻게 테스트하는지 버그를 등록하는 곳과 그게 내가 잘못한게 아닌지 어떻게 구분하는지 알 수 있다 영상 촬영 중이지만 빠른 작업 속도와 작업 기록이 긴게 우선 배워야할 점 PUSH_DESCRIPTOR 쓰면 amd 에서 안될거라하는데; 안드로이드 예제엔 uniform을 대상으로 존재한다. 직접 테스트해봐야 되 듯
meshlet 이건 대체 머냐; https://blog.icare3d.org/ which are used to ultimately generate a compact mesh description called a Meshlet https://devblogs.nvidia.com/introduction-turing-mesh-shaders/ 이런 신기능은 보통 테스트 안하는 편인데; 요즘 핫한 아래에 나와있어서 강제로 테스트 niagara: Optimizing mesh rendering 할려고 했는데; turning 구조부터 된다네; 2070 이 미니멈 된장 상상코딩하게 생김 https://www.dsogaming.com/news/nvidia-rtx-series-3x-faster-in-mesh-shading-i..
- Total
- Today
- Yesterday