با استفاده از این دستور به استفاده بهینه تری از حافظه و همچنین کاهش مصرف زمان پردازش دست می یابیم،نتیجه 6 آزمونی که برای جمع دوبردار با 8192 عنصر اجرا شد با استفاده از این دستور و همچنین بدون استفاده از آن در جدول زیر آمده است.
شماره آزمون | با استفاده از دستورcudaDeviceSynchronize | بدون استفاده از دستور cudaDeviceSynchronize |
1 | 2479028microsecond | 2486615microsecond |
2 | 2503691microsecond | 2573641microsecond |
3 | 2576774microsecond | 2570786microsecond |
4 | 2470012microsecond | 2629837microsecond |
5 | 2571920microsecond | 2710080microsecond |
6 | 2495909microsecond | 2618598microsecond |