Name		Name	Last commit message	Last commit date
Latest commit History 61 Commits
energon		energon
example		example
tests		tests
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
__init__.py		__init__.py
requirements.txt		requirements.txt
setup.py		setup.py

Repository files navigation

ColossalAI-Inference

Temporary repo for large-scale model inference.

Installation

$ git clone https://github.com/hpcaitech/ColossalAI-Inference.git
$ python setup.py install or python setup.py develop

Quick Start

# To pack the distributed inference as a service, we rely on Triton python backend.
$ docker run --gpus all --name=triton_server -v /<host path>/workspace:/opt/tritonserver/host --shm-size=1g --ulimit memlock=-1 -p 10010:8000 -p 10011:8001 -p 10012:8002 --ulimit stack=67108864 -ti nvcr.io/nvidia/tritonserver:21.10-py3

$ git clone https://github.com/triton-inference-server/python_backend -b r<xx.yy>

$ mv /examples/energon /opt/tritonserver/python_backend/models

$ bash run_gpt.sh

Technical Overview

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

ColossalAI-Inference

Installation

Quick Start

Technical Overview

About

Releases 1

Packages

Contributors 12

Languages

License

hpcaitech/EnergonAI

Folders and files

Latest commit

History

Repository files navigation

ColossalAI-Inference

Installation

Quick Start

Technical Overview

About

Resources

License

Stars

Watchers

Forks

Releases 1

Packages 0

Contributors 12

Languages

Packages