Name		Name	Last commit message	Last commit date
Latest commit History 73 Commits
energon		energon
example		example
tests		tests
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
requirements.txt		requirements.txt
setup.py		setup.py

Repository files navigation

ColossalAI-Inference

Temporary repo for large-scale model inference.

Installation

$ git clone https://github.com/hpcaitech/ColossalAI-Inference.git
$ python setup.py install or python setup.py develop

Quick Start

# To pack the distributed inference as a service, we rely on Triton python backend.
$ docker run --gpus all --name=triton_server -v /<host path>/workspace:/opt/tritonserver/host --shm-size=1g --ulimit memlock=-1 -p 10010:8000 -p 10011:8001 -p 10012:8002 --ulimit stack=67108864 -ti nvcr.io/nvidia/tritonserver:21.10-py3

$ git clone https://github.com/triton-inference-server/python_backend -b r<xx.yy>

$ mv /examples/energon /opt/tritonserver/python_backend/models

$ bash run_gpt.sh

Technical Overview

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

ColossalAI-Inference

Installation

Quick Start

Technical Overview

About

Releases 1

Packages

Contributors 12

Languages

License

hpcaitech/EnergonAI

Folders and files

Latest commit

History

Repository files navigation

ColossalAI-Inference

Installation

Quick Start

Technical Overview

About

Resources

License

Stars

Watchers

Forks

Releases 1

Packages 0

Contributors 12

Languages

Packages