tangledgroup · arrizalamin · Jul 23, 2024
diff --git a/00-llama-cpp-enable-main.patch b/00-llama-cpp-enable-main.patch
@@ -1,8 +1,8 @@
 diff --git a/CMakeLists.txt b/CMakeLists.txt
-index 427015be..e945a722 100644
+index 79370912..a3c3bc00 100644
 --- a/CMakeLists.txt
 +++ b/CMakeLists.txt
-@@ -1157,6 +1157,7 @@ endif()
+@@ -188,6 +188,7 @@ install(FILES "${CMAKE_CURRENT_BINARY_DIR}/llama.pc"
  #
 
  add_subdirectory(common)
@@ -11,11 +11,11 @@ index 427015be..e945a722 100644
  if (LLAMA_BUILD_TESTS AND NOT CMAKE_JS_VERSION)
      include(CTest)
 diff --git a/examples/main/main.cpp b/examples/main/main.cpp
-index 0ed4d79f..74b77cc9 100644
+index a0d817b1..5dff0482 100644
 --- a/examples/main/main.cpp
 +++ b/examples/main/main.cpp
-@@ -911,6 +911,9 @@ int main(int argc, char ** argv) {
-         llama_save_session_file(ctx, path_session.c_str(), session_tokens.data(), session_tokens.size());
+@@ -975,6 +975,9 @@ int main(int argc, char ** argv) {
+         llama_state_save_file(ctx, path_session.c_str(), session_tokens.data(), session_tokens.size());
      }
 
 +    printf("\n");

diff --git a/build-multi-thread.sh b/build-multi-thread.sh
@@ -4,7 +4,7 @@ set -e
 LLAMA_CPP_WASM_BUILD_DIR=build
 LLAMA_CPP_WASM_DIST_DIR=dist
 LLAMA_CPP_WASM_DIST_LLAMA_DIR=$LLAMA_CPP_WASM_DIST_DIR/llama-mt
-LLAMA_CPP_GIT_HASH="8c933b7"
+LLAMA_CPP_GIT_HASH="081fe43"
 LLAMA_CPP_SOURCE_DIR=$LLAMA_CPP_WASM_BUILD_DIR/llama.cpp
 LLAMA_CPP_BUILD_DIR=$LLAMA_CPP_WASM_BUILD_DIR/build
 
@@ -29,7 +29,7 @@ emcc --clear-cache
 emcmake cmake ../../$LLAMA_CPP_SOURCE_DIR
 # export EMCC_CFLAGS="-O3 -pthread -DNDEBUG -flto -s SHARED_MEMORY=1 -s EXPORT_ALL=1 -s EXPORT_ES6=1 -s MODULARIZE=1 -s INITIAL_MEMORY=2GB -s MAXIMUM_MEMORY=4GB -s ALLOW_MEMORY_GROWTH -s FORCE_FILESYSTEM=1 -s EXPORTED_FUNCTIONS=_main -s EXPORTED_RUNTIME_METHODS=callMain -s NO_EXIT_RUNTIME=1"
 export EMCC_CFLAGS="-O3 -msimd128 -pthread -fno-rtti -s USE_PTHREADS=1 -s PTHREAD_POOL_SIZE=32 -DNDEBUG -flto=full -s SHARED_MEMORY=1 -s EXPORT_ALL=1 -s EXPORT_ES6=1 -s MODULARIZE=1 -s INITIAL_MEMORY=800MB -s MAXIMUM_MEMORY=4GB -s ALLOW_MEMORY_GROWTH -s FORCE_FILESYSTEM=1 -s EXPORTED_FUNCTIONS=_main -s EXPORTED_RUNTIME_METHODS=callMain -s NO_EXIT_RUNTIME=1"
-emmake make main -j
+emmake make llama-cli -j
 cd ../..
 
 #
@@ -41,7 +41,7 @@ fi
 
 mkdir -p $LLAMA_CPP_WASM_DIST_LLAMA_DIR
 cp -rv src/llama/* $LLAMA_CPP_WASM_DIST_LLAMA_DIR
-cp $LLAMA_CPP_BUILD_DIR/bin/main.* $LLAMA_CPP_WASM_DIST_LLAMA_DIR
+cp $LLAMA_CPP_BUILD_DIR/bin/llama-cli.* $LLAMA_CPP_WASM_DIST_LLAMA_DIR
 
 rm -rf docs/llama-mt
 cp -rv $LLAMA_CPP_WASM_DIST_LLAMA_DIR docs/
diff --git a/build-single-thread.sh b/build-single-thread.sh
@@ -4,7 +4,7 @@ set -e
 LLAMA_CPP_WASM_BUILD_DIR=build
 LLAMA_CPP_WASM_DIST_DIR=dist
 LLAMA_CPP_WASM_DIST_LLAMA_DIR=$LLAMA_CPP_WASM_DIST_DIR/llama-st
-LLAMA_CPP_GIT_HASH="8c933b7"
+LLAMA_CPP_GIT_HASH="081fe43"
 LLAMA_CPP_SOURCE_DIR=$LLAMA_CPP_WASM_BUILD_DIR/llama.cpp
 LLAMA_CPP_BUILD_DIR=$LLAMA_CPP_WASM_BUILD_DIR/build
 
@@ -29,7 +29,7 @@ emcc --clear-cache
 emcmake cmake ../../$LLAMA_CPP_SOURCE_DIR
 # export EMCC_CFLAGS="-O3 -DNDEBUG -flto -s BUILD_AS_WORKER=1 -s EXPORT_ALL=1 -s EXPORT_ES6=1 -s MODULARIZE=1 -s INITIAL_MEMORY=2GB -s MAXIMUM_MEMORY=4GB -s ALLOW_MEMORY_GROWTH -s FORCE_FILESYSTEM=1 -s EXPORTED_FUNCTIONS=_main -s EXPORTED_RUNTIME_METHODS=callMain -s NO_EXIT_RUNTIME=1"
 export EMCC_CFLAGS="-O3 -msimd128 -fno-rtti -DNDEBUG -flto=full -s BUILD_AS_WORKER=1 -s EXPORT_ALL=1 -s EXPORT_ES6=1 -s MODULARIZE=1 -s INITIAL_MEMORY=800MB -s MAXIMUM_MEMORY=4GB -s ALLOW_MEMORY_GROWTH -s FORCE_FILESYSTEM=1 -s EXPORTED_FUNCTIONS=_main -s EXPORTED_RUNTIME_METHODS=callMain -s NO_EXIT_RUNTIME=1"
-emmake make main -j
+emmake make llama-cli -j
 cd ../..
 
 #
@@ -41,7 +41,7 @@ fi
 
 mkdir -p $LLAMA_CPP_WASM_DIST_LLAMA_DIR
 cp -rv src/llama/* $LLAMA_CPP_WASM_DIST_LLAMA_DIR
-cp $LLAMA_CPP_BUILD_DIR/bin/main.* $LLAMA_CPP_WASM_DIST_LLAMA_DIR
+cp $LLAMA_CPP_BUILD_DIR/bin/llama-cli.* $LLAMA_CPP_WASM_DIST_LLAMA_DIR
 
 rm -rf docs/llama-st
 cp -rv $LLAMA_CPP_WASM_DIST_LLAMA_DIR docs/
diff --git a/docs/example-multi-thread.html b/docs/example-multi-thread.html
@@ -46,6 +46,8 @@ <h2> Demo </h2>
           <option value="https://huggingface.co/stabilityai/stablelm-2-zephyr-1_6b/resolve/main/stablelm-2-zephyr-1_6b-Q4_1.gguf">stabilityai/stablelm-2-zephyr-1_6b Q4_1 (1.07 GB)</option>
           <option value="https://huggingface.co/TKDKid1000/phi-1_5-GGUF/resolve/main/phi-1_5-Q4_K_M.gguf">microsoft/phi-1_5 Q4_K_M (918 MB)</option>
           <option value="https://huggingface.co/TheBloke/phi-2-GGUF/resolve/main/phi-2.Q3_K_M.gguf">microsoft/phi-2 Q3_K_M (1.48 GB)</option>
+          <option value="https://huggingface.co/SanctumAI/Phi-3-mini-4k-instruct-GGUF/resolve/main/phi-3-mini-4k-instruct.Q3_K_M.gguf">microsoft/phi-3-mini-4k Q3_K_M (1.96 GB)</option>
+          <option value="https://huggingface.co/Felladrin/gguf-flan-t5-small/resolve/main/flan-t5-small.Q3_K_M.gguf">google/flan-t5-small Q3_K_M (88.3 MB)</option>
         </select>
 
         <label> Prompt: </label>

diff --git a/docs/example-single-thread.html b/docs/example-single-thread.html
@@ -46,6 +46,8 @@ <h2> Demo </h2>
           <option value="https://huggingface.co/stabilityai/stablelm-2-zephyr-1_6b/resolve/main/stablelm-2-zephyr-1_6b-Q4_1.gguf">stabilityai/stablelm-2-zephyr-1_6b Q4_1 (1.07 GB)</option>
           <option value="https://huggingface.co/TKDKid1000/phi-1_5-GGUF/resolve/main/phi-1_5-Q4_K_M.gguf">microsoft/phi-1_5 Q4_K_M (918 MB)</option>
           <option value="https://huggingface.co/TheBloke/phi-2-GGUF/resolve/main/phi-2.Q3_K_M.gguf">microsoft/phi-2 Q3_K_M (1.48 GB)</option>
+          <option value="https://huggingface.co/SanctumAI/Phi-3-mini-4k-instruct-GGUF/resolve/main/phi-3-mini-4k-instruct.Q3_K_M.gguf">microsoft/phi-3-mini-4k Q3_K_M (1.96 GB)</option>
+          <option value="https://huggingface.co/Felladrin/gguf-flan-t5-small/resolve/main/flan-t5-small.Q3_K_M.gguf">google/flan-t5-small Q3_K_M (88.3 MB)</option>
         </select>
 
         <label> Prompt: </label>

diff --git a/docs/llama-mt/llama-cli.js b/docs/llama-mt/llama-cli.js
diff --git a/docs/llama-mt/llama-cli.wasm b/docs/llama-mt/llama-cli.wasm
diff --git a/docs/llama-mt/main-worker.js b/docs/llama-mt/main-worker.js
@@ -1,6 +1,6 @@
 import { action } from "./actions.js";
 import { loadBinaryResource } from "./utility.js";
-import Module from "./main.js";
+import Module from "./llama-cli.js";
 
 // WASM Module
 let module;

diff --git a/docs/llama-mt/main.js b/docs/llama-mt/main.js
diff --git a/docs/llama-mt/main.wasm b/docs/llama-mt/main.wasm
diff --git a/docs/llama-mt/main.worker.mjs b/docs/llama-mt/main.worker.mjs
diff --git a/docs/llama-st/llama-cli.js b/docs/llama-st/llama-cli.js
diff --git a/docs/llama-st/llama-cli.wasm b/docs/llama-st/llama-cli.wasm
diff --git a/docs/llama-st/main-worker.js b/docs/llama-st/main-worker.js
@@ -1,6 +1,6 @@
 import { action } from "./actions.js";
 import { loadBinaryResource } from "./utility.js";
-import Module from "./main.js";
+import Module from "./llama-cli.js";
 
 // WASM Module
 let module;

diff --git a/docs/llama-st/main.js b/docs/llama-st/main.js
diff --git a/docs/llama-st/main.wasm b/docs/llama-st/main.wasm
diff --git a/src/llama/main-worker.js b/src/llama/main-worker.js
@@ -1,6 +1,6 @@
 import { action } from "./actions.js";
 import { loadBinaryResource } from "./utility.js";
-import Module from "./main.js";
+import Module from "./llama-cli.js";
 
 // WASM Module
 let module;