perf: Optimize tensor conversions in C++ code to avoid unnecessary copies #366

Yard1 · 2024-07-10T22:19:33Z

Small tweak to avoid unnecessary copying by combining to calls. Discovered during profiling.

yzh119

LGTM

@Yard1

Optimize tensor converions in c++ code to avoid unnecessary copies

9530189

yzh119 approved these changes Jul 10, 2024

View reviewed changes

yzh119 changed the title ~~Optimize tensor conversions in C++ code to avoid unnecessary copies~~ perf: Optimize tensor conversions in C++ code to avoid unnecessary copies Jul 10, 2024

yzh119 merged commit 1116237 into flashinfer-ai:main Jul 10, 2024

github-actions bot mentioned this pull request Jul 10, 2024

chore(main): release 0.0.9 #359

Merged

Yard1 deleted the optimize_libtorch_tensor_conversions branch July 10, 2024 23:44

github-actions bot mentioned this pull request Jul 31, 2024

chore(main): release 0.1.4 #415

Merged

github-actions bot mentioned this pull request Dec 25, 2024

chore(main): release 0.3.0 #698

Closed

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

perf: Optimize tensor conversions in C++ code to avoid unnecessary copies #366

perf: Optimize tensor conversions in C++ code to avoid unnecessary copies #366

Yard1 commented Jul 10, 2024

yzh119 left a comment

perf: Optimize tensor conversions in C++ code to avoid unnecessary copies #366

perf: Optimize tensor conversions in C++ code to avoid unnecessary copies #366

Conversation

Yard1 commented Jul 10, 2024

yzh119 left a comment

Choose a reason for hiding this comment